postgresql去重的简单介绍

数据分析校招sql50题-1

1.查询" 01 "课程比" 02 "课程成绩高的学生的信息及课程分数

10年积累的成都网站建设、网站制作经验，可以快速应对客户对网站的新想法和需求。提供各种问题对应的解决方案。让选择我们的客户得到更好、更有力的网络服务。我虽然不认识你，你也不认识我。但先网站设计后付款的网站建设流程，更有镇原免费网站建设让你可以放心的选择与我们合作。

第一步先在分数表中把课程1和课程2的数据分别筛选出之后对比课程1比课程2高的学生id，

第二步结果再与学生表关联

结果：

ps：

2.查询平均成绩大于等于 60 分的同学的学生编号和学生姓名和平均成绩

'''

select sname, student.sid , r.avg_score from student right join

(select sid, avg(score) as avg_score from sc group by sid having avg(score) 60) r

on student.sid = r.sid

PS：

第一步从sc表中将sid去重查出后与student表关联

第二部将符合第一步结果的数据从student表中展示出来

结果：

4.查询所有同学的学生编号、学生姓名、选课总数、所有课程的成绩总和

第一步将sc表中学生按sid分组，并聚合计算数量、总分。同时注意子查询中聚合函数要有别名( as cnum、as sum_score)

第二步将第一步中结果与student表关联

结果：

第一步从teacher表中找到张三老师tid

第二步用tid关联course表找到张三老师教授课程的cid

第三步用cid关联score表找到上过张三老师课程的学生的sid

第四步用第三步的sid关联student表查询出具体符合条件的学生的详细信息

太笨了，多表联合查询：

结果：

排除学全所有课程之外的学生id（not in语法），再与student表关联

结果：

8.查询至少有一门课与学号为" 01 "的同学所学相同的同学的信息

第一步将学号为01的学生所学课程id从sc表中筛选出来

第二步查询sc表中所学课程id在上面得到的结果中的学生id（in语法），去重

第三步查询student表中学生id在上面得到结果中的学生信息（in语法）

mysql有group_concat函数参考

postgresql稍微麻烦点。

---ARRAY_AGG()函数是一个聚合函数，它接受一组值并返回一个数组，其中将输入集中的每个值分配给该数组的元素。

----unnest(anyarray)

返回值:setof anyelement(可以理解为一个(临时)表)

说明:unnest函数将输入的数组转换成一个表,这个表的每一列都代表相应的一个数组中的元素。如果unnest与其他字段一起出现在select中，就相当于其他字段进行了一次join。

----array_to_string("数组",",") 即把数组转化为字符串，并用“,”连接(使用提供的分隔符连接数组元素)

结果:

第一步查出张三老师教授的课程id

第二步在sc表中查出上过张三老师课程的学生id

第三步将结果的非（not in）去筛选student表

使用sqoop将hive中的数据导入关系型数据库怎么去重

直接导入hive表

sqoop import --connect jdbc:postgresql://ip/db_name--username user_name --table table_name --hive-import -m 5

内部执行实际分三部，1.将数据导入hdfs（可在hdfs上找到相应目录），2.创建hive表名相同的表，3，将hdfs上数据传入hive表中

sqoop根据postgresql表创建hive表

sqoop create-hive-table --connect jdbc:postgresql://ip/db_name --username user_name --table table_name --hive-table hive_table_name( --hive-partition-key partition_name若需要分区则加入分区名称)

导入hive已经创建好的表中

sqoop import --connect jdbc:postgresql://ip/db_name --username user_name --table table_name --hive-import -m 5 --hive-table hive_table_name (--hive-partition-key partition_name --hive-partition-value partititon_value);

使用query导入hive表

sqoop import --connect jdbc:postgresql://ip/db_name --username user_name --query "select ,* from retail_tb_order where \$CONDITIONS" --hive-import -m 5 --hive-table hive_table_name (--hive-partition-key partition_name --hive-partition-value partititon_value);

注意：$CONDITIONS条件必须有，query子句若用双引号，则$CONDITIONS需要使用\转义，若使用单引号，则不需要转义。

【转】PostgreSQL多行变一行

PGSQL多行聚合，PGSQL多行合并为一行，PGSQL多行合并

《PostgreSQL 多行变一行》

《PostgreSQL官方文档-聚集函数》

array_agg(distinct(字段名)) 去重后可以获得拼接唯一的字段

本文题目：postgresql去重的简单介绍
链接分享：http://ybzwz.com/article/dscseoc.html

postgresql去重的简单介绍

数据分析校招sql50题-1

使用sqoop将hive中的数据导入关系型数据库怎么去重

【转】PostgreSQL多行变一行

其他资讯