当前位置: 代码网 > it编程>前端脚本>Python > 超级赞!这是我见过的NLP算法岗(含大模型方向)最全的面试题(汇总版)

超级赞!这是我见过的NLP算法岗(含大模型方向)最全的面试题(汇总版)

2024年07月31日 Python 我要评论
年底了,技术群组织了一场算法岗技术&面试讨论会,邀请了一些同学分享他们的面试经历,讨论会会定期召开,

年底了,技术群组织了一场算法岗技术&面试讨论会,邀请了一些同学分享他们的面试经历,讨论会会定期召开,如果你想加入我们的讨论群或者希望要更详细的资料,文末加入。

喜欢本文记得收藏、关注、点赞。

bat 两个

大家好,今年秋招收获: bat两个oc一个评估中,其余互联网oc*2,积点功德,等更多oc,offer

  • 岗位:nlp 算法岗
  • 学习:南京大学
  • 专业:计算机类

面试oj题

  1. 字典树构建,用字典树做搜索/分词; 求平方根
  2. 编辑距离,正则表达式匹配,寻找两个有序数组中位数,合并k个升序链表变体,岛屿数量,二叉树层次遍历,二叉树最大路径和,数组中第k大的元素等(lc hot100)
  3. python解析json结构,正则表达式匹配(re)
  4. 手撕: multihead self attention, logistic regression, layernorm(pytorch可用)

大模型:

今年nlp面试感觉逃不了大模型

  1. deepspeed框架介绍
  2. lora介绍,了解什么其他高效微调方法
  3. prompt tuning, instruct tuning, fine tuning差别
  4. llama中per norm,rmsnorm的介绍,优劣,position embedding构造方法
  5. prompt构造经验,怎样的prompt更好

业务场景

可能是本人业务经验少,问得大部分都是“从0开始构建xxx”的问题,比如“从0开始构建推荐系统”
另外,还有很多大数据场景问题,如海量数据中敏感词检测,海量任务调度等

概率题

绝大部分都是经典题,还有大数定理,连续分布的均值方差公式,有时需要用牛莱公式算积分(ps. 拉格朗日乘子法,一阶泰勒展开要熟悉)

平安科技

  • 岗位:nlp算法岗(实习)
  • 学校:苏州大学
  • 专业:计算机类

1.自我介绍;

2.主要用过哪些深度学习框架(pytorch);

3.介绍自己的论文和项目;

4.什么是元学习(项目和论文中用到了);

5.多任务学习的一些框架(项目和论文中用到了,sharedbottom、mmoe、srn等);

6.介绍一下lr回归、xgboost、gbdt,以及他们的优缺点;

7.介绍一下bert和chactgpt;

8.如何处理文本信息(word2vec);

9.有用过c++吗,说一下c++的三个特性(封装、集成、多态);

10.sql有使用过吗,只会最简单的增删改查;

11.了解哪些深度学习模型(mlp、cnn、rnn、transformer),说一下各自的优缺点;

12.rnn有哪些问题(梯度消失、梯度爆炸),如何缓解(使用lstm结构,引入门控机制);

13.可以实习多长时间,学校导师放实习吗;

12.反问(实习主要做什么,自己应该补充哪些知识);

13.总结:本身是做推荐相关的,没有问太多nlp相关的内容,需要恶补一下nlp相关的知识,总体面试感觉良好;

金山

nlp算法面经(实习,换部门又面了一次)

之前面试金山武汉的部门给我挂了,但是因为又投了金山珠海的部门,所以又从头再来了一遍流程,希望这一次运气好点😅。

一面面试题目

1.计算机基础
(1)解决哈希冲突的方法
(2)哈夫曼树
(3)动态规划算法思想

2.word2vector的两种改进方法

3.在语言模型算法中可不可以使用两层lstm

4.讲解一下论文课题中的序列标注任务

5.有没有大模型相关的微调经验?

6.人类反馈强化学习算法流程

7.反问

感觉问的问题挺灵活的,我回答的也挺灵活😅,希望一面能过吧。

百度

岗位:nlp 算法岗(实习)

一面

  1. 首先是自我介绍加一个项目介绍 介绍了研究生期间的课题
    用了什么方法?提升了多少指标?分析过badcase吗?

  2. 简历有写大模型微调 问了目前的大模型微调方法你觉得哪一个最好?

  3. 反问

二面

  1. 自我介绍

  2. 介绍命名实体识别项目,实体嵌套怎么解决?

  3. 介绍大模型角色扮演项目,数据集怎么构建?原本微调后大模型只能扮演一个角色,问训练一次能否实现大模型的多个角色转换,怎么实现?

  4. 介绍下chatgpt?了解其它大模型吗?chatgpt一阶段预训练和二阶段指令微调有什么区别?

  5. bert的预训练任务有什么?为什么引入下一个句子预测任务?了解bert变体吗?robert和bert区别在哪?

  6. 一道算法题-最长递增子序列

  7. 反问

总结:面试体验很好,专业性很强,hr反馈也很及时,现在offer评估中 许愿上岸!

oppo

岗位:提前批nlp算法岗

一面

之前投的是大模型,hr后面让我转岗了。

1.介绍第一个实习做的工作

2.介绍第二个实习的工作

3.介绍论文的工作

没有八股

手撕代码leetcode 769 没写出来,让面试官换成最长公共前缀了。。。

面试半小时结束了

二面半小时

  1. 介绍你最拿得出手的一个工作

  2. 介绍实习工作

  3. 有没有关注过机器翻译方向

  4. 无重复数字的全排列,口述算法思路。

  5. 一些别的个人情况介绍

滴滴

  • 岗位:提前批nlp算法
  • 学校:university of pennsylvania
  • 专业:计算机类
  1. 自我介绍

  2. 简历内容项目细问(每个和nlp有关的都问了)

  3. 了解哪些大模型

  4. 介绍bert

  5. 相对位置编码的好处

  6. 介绍word2vec和优化方法

  7. bert为什么用layernorm不用batchnorm

  8. 算法:找出和为给定目标值(target)的连续子数组

最后一道题忘记双指针可以做了,只想到暴力dfs了感觉题刷的还是不够,面试一紧张就容易做不出来

百度

岗位:nlp算法岗(日常实习)

一面

  1. ptq和qat的区别

  2. 如果对embedding也做量化,你觉得会有什么问题

  3. 说一下常见的量化方法和原理

  4. 假如现在让你对transformer模型进行量化,你觉得需要量化哪些算子

  5. 矩阵乘法算子的量化过程

手撕(如流ide)

  1. 搜索二维矩阵 ⅱ lc原题
  2. top k
  3. python pep9规范 问题

二面

  1. slu和nlu的区别

  2. 其他机器学习八股文

手撕(如流ide)
合并排序的数组 lc原题

三面

主管面,技术聊的比较少
走棋盘的多种解法:dp + 概率论

shein

岗位:nlp 算法岗
学校:中科大
专业:计算机类

一面

1.介绍一下blip2的架构;你觉得blip2的优势是什么;和之前的多模态模型有什么区别?

2.是怎么在电商领域微调的?

3.模型蒸馏是怎么做的?有试过无监督样本训练吗?

  1. 手撕代码,一个元素在一个有序数组的第一次出现位置。

二面

transformer的多头注意力的作用

介绍一下实习工作

写题:无序数组的中位数

笔试代码题没写出来,问我现在会不会写

快手

nlp 算法岗

手撕lru

手推两层网络的反向传播算法

手推transformer的注意力机制

svm 损失函数

f1为什么是1

auc计算

了解的激活函数

了解的优化算法

bert为什么是双向机制,gpt呢

transformer的多头是为什么

科大讯飞

飞星计划-ai算法(自然语言处理方向)

1.自我介绍

2.jieba 分词的原理

3.word2vec的原理,怎么训练的

3.有没有了解chatgpt是怎么训练出来的(项目涉及)

4.简述bert模型

5.pytorch中的train,val模块

6.怎么爬维基百科的,一天能爬多少条

7.在爬数据的时候有遇到哪些反爬的机制

8.mysql数据库的存储引擎,索引类型(聚簇索引、二级索引)

9.为啥想做ai

10.python中字典的结构,是用啥实现的

11.有一组无序数组,怎么取前10个最大的数

之前看面经说是归并排序,但hr说这不是最快的方法。

12.反问

技术交流群

前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与 10000+来自港科大、北大、清华、中科院、cmu、腾讯、百度等名校名企开发者互动交流~

我们建了nlp&大模型面试与技术交流群, 想要进交流群、需要源码&资料、提升技术的同学,可以直接加微信号:mlc2060。加的时候备注一下:研究方向 +学校/公司+csdn,即可。然后就可以拉你进群了。

用通俗易懂方式讲解系列

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com