昊博集团NLP算法工程师笔试题(40分钟)

——涉及python编程,机器学习,深度学习相关知识
姓名
    ____________
电话
    ____________
学校专业
    ____________
一、单选题(共40分,每题4分)
1、以下哪个运算符可以用于表示取整?
/
//
%
*
2、在python函数中,如果函数没有使用return语句,则函数返回的是?
None对象
任意整数
错误!函数必须要有返回值。
0
3、以下代码的输出结果是?
numbers = [1, 3, 6]
newNumbers = tuple(map(lambda x: x , numbers))
print(newNumbers)
[1,3,6]
(1,3,6)
[2,6,12]
(2,6,12)
4、3*1**3 表达式输出结果为?
1
3
9
27
5、以下可以用于计算两个词向量之间的距离?
词形还原(Lemmatization)
余弦相似度(Cosine Similarity)
TF-IDF
N-grams
6、以下哪个算法可用于分类?
K-MEANS
高斯混合模型(GMM)
自组织映射神经网络(SOM)
支持向量机(SVM)
7、以下哪种算法需要指定聚类个数?
K-MEANS
DBSCAN
KNN
支持向量机(SVM)
8、下图表示的是哪种激活函数的曲线图?
Sigmoid
Tanh
Relu
ELU
9、下列哪个不是LSTM的门结构?
遗忘门
记忆门
输入门
输出门
10、下面关于 Random Forest 和 Gradient Boosting Trees 说法正确的是?
Random Forest 的中间树不是相互独立的,而 Gradient Boosting Trees 的中间树是相互独立的
两者都使用随机特征子集来创建中间树
在 Gradient Boosting Trees 中可以生成并行树,因为它们是相互独立的
无论任何数据,Gradient Boosting Trees 总是优于 Random Forest
二 多选题(共20分,每题5分)
1、下列哪些属于自然语言处理NLP常见的任务?
序列标注
文本分类
人脸识别
机器翻译
2、样本分布不均时,可以采用哪些方法?
文本增强
文本删除
过采样
欠采样
3、Python编程语言中,以下哪种是可变数据类型?
List
Set
Dict
Tuple
4、以下几种说法中,正确的是?
可以用for循环的对象都是Iterable类型;
可以用next()函数的对象都是Iterator类型;
list、set都是Iterator但不是Iterable;
for循环的本质就是通过不断调用next()函数实现;
三 简答题(共40分)
1、简述什么是RNN和LSTM?LSTM相对RNN有什么特点?
    ____________
2、请设计一个可用于任何函数并可打印出函数执行时间的装饰器?python编程
    ____________

22题 | 被引用0次

使用此模板创建