自然语言处理技术的应用

NLP将如何塑造科技世界的未来?

自然语言处理或NLP是人工智能的一个分支,对计算机和人类交互的方式有着许多重要的影响。 成千上万年发展起来的人类语言已经成为一种细微的交流形式,它传递了大量的信息,而这些信息往往超越单词。 NLP将成为缩小人类通信与数字数据之间差距的重要技术。 以下是未来几年自然语言处理的5种方法。

05年1月

机器翻译

Liam Norris / Stone / Getty Images

随着世界的信息在线,使数据可访问的任务变得越来越重要。 在跨语言障碍的情况下向所有人提供世界信息的挑战已经超出了人类翻译的能力。 Duolingo等创新公司正在寻找大量人才来贡献自己的力量,通过翻译工作与学习一门新语言相一致。 但是机器翻译为统一世界信息提供了一个更具可扩展性的替代方案。 Google是一家处于机器翻译前沿的公司,为其Google翻译服务使用专有的统计引擎。 机器翻译技术的挑战不在于翻译单词,而在于保留句子的含义,这是一个复杂的技术问题,是NLP的核心。

05年05月

打击垃圾邮件

垃圾邮件过滤器已成为防止不断增加的垃圾邮件问题的第一道防线。 但几乎每个广泛使用电子邮件的人都会对已收到的不需要的电子邮件或者意外收到的重要电子邮件感到痛苦。 垃圾邮件过滤器的假阳性和假阴性问题是NLP技术的核心,它再次陷入了从文本串中提取含义的挑战。 一项受到广泛关注的技术是贝叶斯垃圾邮件过滤,一种统计技术,通过这种统计技术,可以测量电子邮件中单词的发生率,并将其与垃圾邮件和非垃圾邮件中的典型事件进行比较。

05年3月

信息提取

金融市场中的许多重要决策日益摆脱人类的监督和控制。 算法交易正变得越来越流行,这是一种完全由技术控制的金融投资形式。 但许多这些财务决策受到新闻的影响,新闻仍然主要以英文呈现。 那么NLP的一项主要任务就是将这些纯文本公告变为可能,并以可以计入算法交易决策的格式提取相关信息。 例如,公司之间合并的消息可能会对交易决策产生重大影响,并且合并,参与者,价格以及谁可以将其纳入交易算法的详细信息的速度可能会对利润产生影响数百万美元。

04年05月

概要

信息超载是我们数字时代的现实现象,而且我们对知识和信息的获取远远超出了我们理解它的能力。 这是一个没有放缓迹象的趋势,因此总结文件和信息含义的能力变得越来越重要。 这一点非常重要,不仅仅是让我们能够识别和吸收海量数据中的相关信息。 另一个理想的结果是了解更深层次的情感意义,例如,基于社交媒体的汇总数据,公司能否确定其最新产品的总体情绪? NLP的这个分支将作为一种有价值的营销资产变得越来越有用。

05年05月

问题回答

搜索引擎将世界上丰富的信息放在我们的指尖,但实际上回答人们提出的具体问题时,通常仍然很原始。 谷歌已经看到了这种情况对用户造成的挫折,他们经常需要尝试大量不同的搜索结果来找到他们正在寻找的答案。 Google在NLP方面的努力的一个重点是识别自然语言问题,提取意义并提供答案,而Google结果页面的演变显示了这一焦点。 尽管有了一定的提高,但这仍然是搜索引擎面临的主要挑战,也是自然语言处理研究的主要应用之一。