自然语言处理工程师面试问题
一种自然语言处理(NLP)工程师开发依靠计算机对人类语言进行智能处理的产品。示例应用包括构建智能导师、自动总结新闻文章的系统或识别并理解人类语言的系统。除了在自然语言处理方面有较强的基础外,机器学习、文本挖掘、信息理论和信息检索等相关领域有较强的能力。这些自然语言处理面试问题还将测试你是否熟悉专业工具,以及是否有使用自然语言数据(如nltk (Python)、Apache OpenNLP或GATE)的项目经验。有语言学知识通常是一个很大的加分项。流利掌握一门或多门外语同样重要。这往往是一个非常技术性的角色,所以研究技能也非常重要。计算机科学通常是这类角色的背景选择,但有些非常成功地通过强调计算语言学的语言学背景来实现这一目标。
特定角色问题
(自然语言处理)
- 什么是演讲(POS)标记的一部分?建立一个可以想象的POS标签的最简单方法是什么?
- 给出划痕的帖子中如何构建POS标记器?你会如何处理未知的单词?
- 您如何训练一个模型,该模型标识句子中的“Apple”一词是否属于水果或公司?
- 您如何在新闻文章中找到引用文本的所有发生?
- 您如何构建自动纠正由语音识别系统生成的文本的系统?
- 什么是潜在的语义索引,它可以在哪里应用?
- 您如何构建一个系统将英文文本翻译为希腊语,反之亦然?
- 您如何构建一个自动组织主题新闻文章的系统?
- 什么是停止的话?描述应删除停止单词的应用程序。
- 您如何设计模型来预测电影评论是否是积极的或负面的?
(相关领域,如信息理论,语言学和信息检索)
- 熵是什么?你如何估计英语的熵?
- 什么是常规语法?这是否会对正则表达的权力不同,如果是的话,以什么方式?
- 什么是单词的TF-IDF分数,在哪些上下文中是有用的?
- PageRank算法如何工作?
- 什么是依赖解析?
- 建设和使用棕色语料库等注释语料库的困难是什么?可以进行减轻它们?
(工具和语言)
- 您使用过哪种工具NLP模型(NLTK,Apache Opennlp,Gate,Mallet等)?
- 你有构建本体的经验吗?
- 您是否熟悉Wordnet或其他相关语言资源?
- 你会说任何外语吗?