面试题-阶段检测
- 1.sql关键词的执行顺序是?
- 2.如何计算七日留存?
- 3.给你一个包含几行几列的 dataframe,包括文字,特殊符号,和数据让你找出异常值,然后删除data ={
'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],'age':[25,-30,35,40,'unknown'],
'income':[50000,60000,-70000,45000,55000],'address': ['NY','LA','SF','unknown','LA']}
牛客网-非技术入门
- 除”复旦大学“以外的信息:用<>"复旦大学”
- 字段内包含”北京“字符的信息:用like “%北京%”
- 字符串截取:substring_index(字段,分隔符,计数)
- 日期格式
- mid(字段名,起始位置,要返回的字符数)
- 分组后过滤,聚合函数结果作为筛选条件:不能用where,而是用having语法
- 在百分比后面加%
- 数字取整,用于MySQL:CAST(... AS SIGNED) 转换成整数
- 时间戳相减,指定时间单位:TIMESTAMPDIFF()
- 一周中的第几天:dayofweek()
- 计算除法并获取整数结果和余数
- 查找每个学校用户的平均答题数目:总答题量 / 去重后的用户数,用device_id连接表
- 多个表连接:连接+条件+连接+条件…:… as a join … as b on a….=b…. join … as c on a….=c….
- 计算新字段时,引用字段需要注明来自哪个表
- 分别查看&结果不去重:union all 不去重两个表上下连接;union是去重的