艾巴生活网

您现在的位置是:主页>科技 >内容

科技

人工智能技术应用包括哪些(人工智能技术有哪些应用)

2024-11-16 20:35:01科技帅气的蚂蚁
企业需要了解图像识别、语音识别、聊天机器人、自然语言生成和情感分析如何改变其业务的运营模式。人工智能技术正在将自己融入商业的方方面

人工智能技术应用包括哪些(人工智能技术有哪些应用)

企业需要了解图像识别、语音识别、聊天机器人、自然语言生成和情感分析如何改变其业务的运营模式。

人工智能技术正在将自己融入商业的方方面面。一些重要的人工智能技术包括图像识别、语音识别、聊天机器人、自然语言生成和情感分析。

需要明确的是,每种类型的人工智能技术都代表了广泛的类别,通常包括几十个甚至上百个基本组件。反过来,这些组件通常被重组为更复杂的应用程序,为企业创造价值。

例如,百货公司的人工智能机器人可以在工作中使用图像识别、文章和语音识别技术。图像识别软件将使其能够检查货架上存货的位置、价格和数量;文章将帮助他们避开任何障碍,并确定他们在商店中的位置;语音识别组件将使其能够引导和娱乐客户。

为了实现这一成就,这些业务中的人工智能技术通常会结合针对整个任务特定部分量身定制的各种算法和技术。它们包括符号处理、统计分析、神经网络等。

以下是对五种人工智能技术的深入阐述。这些技术随着时间的推移而发展,从而极大地改变了企业处理、分析和生成数据的方式。

1.图像识别

企业图像识别的各种使用方式包括:工厂生产线上的自动检查、保险中的损失估计、图像中物体的识别、人数的统计、制造过程的控制、顾客进店等事件的检测和真实世界模型的生成。

人工智能技术必须找到一种方法,用各种人工智能算法可以处理的数字来描述世界。在视觉方面,研究人员发现了如何将一张图片分成像素网格,这样每个像素就可以用一个数字来表示。早期是用一个数字来描述每个像素的亮度。后来发现可以用三个或者更多的数字来描述每个像素中不同颜色的亮度。

20世纪60年代,研究人员开始探索如何利用光学字符识别(OCR)技术的原始形式的软件图像识别功能来识别数字文档中的字符。其他研究人员开始探索基于图像的场景解释技术,试图从2D图像重建三维图像。多年来,这些技术已经成为机器视觉行业工具包的一部分。

后来,研究人员发现,图像识别可以被组织为一个分层的过程,以便更容易解释日益复杂的现象。例如,黑白像素可以被识别为直线和曲线,而直线和波浪被识别为数字的一部分。训练算法学习如何根据这些曲线图案而不是每个像素的亮度来解释字符要容易得多。同样,根据图像是否包含两只眼睛和形状合适的耳朵,而不是每个像素中颜色的原始亮度,更容易确定图像是否是猫。

这种处理方法有望推动图像识别领域的发展。然而,事实并非如此。直到2012年左右,随着AlexNet(一种旨在支持图像识别的八层卷积神经网络)的发展,研究人员发现了如何扩展这一过程,以识别数千种不同类型的对象。

AlexNet等深度学习技术的优势在于,这种模型可以自动学习以不需要人类以编程方式指定每个步骤的方式执行各种图像识别任务。研究人员指出了如何将神经网络应用于不同类型的问题。该功能还促进了深度学习在其他类型应用中的使用。

现在,图像识别被用于识别货架上的产品、图片或文章中的人、生产线上的缺陷以及自动驾驶汽车在街上遇到的物体。随着冠状病毒的爆发,许多企业正在开发应用程序来监控社交距离的规则。

商业领袖的一个关键见解是,通常可以通过在应用程序中使用多种类型的图像识别来创造更多价值。例如,智能文档处理和文档智能结合了一套人工智能技术,包括自然语言处理和机器学习,以难以识别的格式捕获和分类数据。结合光学字符识别(OCR),智能文档处理可以分析文档的视觉布局,以确定哪个部分代表产品、发票金额或销售条款,并将这些信息提供给其他业务应用程序。

值得注意的是,企业中的大部分图像识别应用都是高度场景化的。供应商和研究人员经常宣传新的图像识别改进,例如在识别肿瘤方面击败医学专家的软件。但在实践中,只有当图像以正确的角度拍摄时,人工智能才能使用一套特定的设备来处理这些射线图像,而人类擅长分析从许多不同角度拍摄的各种图像。

研究人员还发现,在这些图像识别应用程序的一些实现中存在隐藏的偏见。为了减少偏见,专家建议这些应用程序应该用代表要处理的特定类型图像的数据进行训练。

2.语音识别

需要许多算法来将语音转换成文本,并为数字处理做准备。尽管语音识别系统越来越好,但即使是当今最好的语音识别系统也仍然容易出现错误,因此在安全关键的应用中(如医疗数据捕获)需要进行一些验证。

1952年,贝尔实验室的研究人员开发了第一个语音识别系统来识别单个数字。到1962年,IBM推出鞋盒机,可以理解16个单词。到了20世纪80年代中期,研究人员开始使用统计技术(如隐马尔可夫模型)开发可以理解2万个单词的应用程序,但单词之间会有停顿。龙听写,第一款消费听写产品,发布于1990年。它可以根据声音自动打字。接着,ATT公司推出了一款语音识别应用,可以不用人工转接电话。这些早期的系统要么适合特定环境的词汇量很小,需要单个语音进行大量的训练。

自2010年以来,研究人员发现了将深度神经网络应用于语音识别的方法。这种增长的主要驱动力之一是需要找到一种更好的方法来表现不同类型的智能扬声器的声音特性。这需要探索一种更好的方法来将原始音频数据转换成人类习惯听的独特声音(称为音素)(例如C 在单词汽车).

研究人员还结合基本的语音识别结果和更好的场景来区分同音异义词(bear/bare)。云计算服务现在提供各种核心的语音到文本服务,然后开发人员将它们集成到各种企业工作流中。

的基本语音识别功能是通过微软Cortana、Google Now、苹果Siri等云计算服务嵌入到现代智能手机和电脑中的。亚马逊利用语音识别技术推出了一种新的方式,通过Alexa语音服务在智能手机之外连接互联网。这些服务通常在云平台中做繁重的工作。最近,谷歌通过开发更有效的算法提高了标准,这些算法可以在其Pixel手机上本地运行语音识别应用程序。

语音识别技术在企业中的使用越来越多。一些供应商也开始开发自动记录电话会议和现场会议的应用程序,以实现合规或更好地记录决策过程。自动语音识别还可以帮助监控呼叫中心的活动,以确保工作人员遵循正确的程序,这样经理就不会不需要听到每一个电话。语音识别应用程序也被用于为国际旅行者自动翻译语言。这种人工智能技术的其他商业应用包括家庭自动化、文章游戏交互和用于索引文章的自动隐藏字幕。

3.聊天机器人

Dialogic人工智能技术允许应用程序以自然的方式与人类交互。第一个聊天机器人Eliza于1964年至1966年在麻省理工学院人工智能实验室开发。最早的聊天机器人在词汇和可以允许的交互类型方面是有限的。这些应用程序使用决策树,决策树根据查询或用户对问题的回答沿着不同的路径运行。从20世纪80年代到90年代,这些技术被扩展到自动电话应用,其中交互通过使用IVR技术的拨号声音或简单的单词来控制。

最近,由于用于解释和响应文本查询的更好的自然语言处理技术,以及与其他服务的更好集成,企业更容易自动设置可以响应常见问题的聊天机器人。聊天机器人的应用激增,接受命令或定制对给定用户的响应。最近,聊天机器人应用的一个关键见解是开发一个应用程序编程框架,用于表达用户的意图和适当的反应。

面向外部的聊天机器人可以帮助客户互动的许多方面实现自动化。它们还允许企业以更具吸引力的方式在各种社交媒体渠道(如脸书)进行推广。

企业应用程序的开发和部署见证了chatbot技术使用的爆炸式增长,该技术将chatbot与能够自动配置应用程序和基础设施并生成报告的操作工具相结合。聊天集成使团队能够记录他们的流程,从而更容易处理重复出现的问题,或者确定特定流程在过去是如何执行的。

聊天工具开始进入商业的其他方面,以帮助记录部门内部或部门之间的各种通信,尤其是越来越多的公司采用Slack和微软Teams等消息应用程序。财务部门可以使用聊天机器人来生成和跟踪重要业务指标的状态。销售团队可以使用聊天机器人来收集关键客户的数据。

聊天机器人还可以帮助促进其他类型的内部互动。例如,员工可能会要求HR聊天机器人询问他们的福利状况或请假。企业还使用聊天机器人来自动化与IT系统管理的交互,以处理简单的问题或自动分类更复杂的问题。

4.自然语言的产生

随着数据量的增加,可能很难为员工或客户确定正确的信息优先级。自然语言生成(NLG)应用程序可以帮助查找、组织和总结给定用户的最合适的见解。

这种人工智能技术根据不同的业务用例有不同的风格。自然语言生成开始作为商业智能和分析应用程序的前端,作为Gartner创建的新应用程序类别的一部分。这些技术结合了解释纯文本查询和为纯英语分析生成适当摘要的能力。例如,美国宇航局已经建立了一个自然语言生成(NLG)应用程序,以改善它向商业用户提供的关于不同保险产品销售的答案。

这种人工智能技术的另一个特点是,它改进了向用户呈现产品信息的方式。在这些类型的应用中,自然语言生成引擎可以根据用户定制产品描述的偏好。例如,可能会向更多的技术用户深入介绍新手机耳机等产品的技术特征,而具有时尚意识的买家将获得关于其外观和感觉的美学描述。自然语言生成(NLG)还可以帮助改进将内容翻译到新市场的方式。

Trulia Company正在使用自然语言生成(NLG)来自动生成房地产列表的社区描述。自然语言生成(NLG)也用于为美联社制作基本的新闻文章。《Esquire Singapore》甚至以人工智能应用的故事出了一期特刊。然而,这种人工智能技术仍处于初级阶段,专家提醒企业和医疗及其他需要新质量控制的关键应用。

尽管如此,企业仍然可以从自然语言处理框架的最新改进中受益。新的自然语言处理指标正在出现,以帮助企业评估给定框架的效用,并改进自然语言生成(NLG)应用程序的这些实现。

5.情感分析

当人们写关于事件、品牌、政治家和其他事物的文章时,他们通常会表达不同类型和强度的情绪。情绪分析领域始于20世纪50年代,当时营销人员分析书面文件的语气。但这是一个非常人为的过程。然而现在,几乎每个人都在社交媒体、博客、新闻评论、评论、支持论坛和与公司的通信中留下了情绪化的数字痕迹。

各种人工智能技术,包括自然语言处理、机器学习和统计学,被用来分析这些数字足迹的情感基调。这些工具有助于跟踪产品或服务的变化如何影响客户,而无需直接询问他人。这也有助于密切关注竞争对手产品和活动。

情感分析的另一个用例可以识别所谓的品牌影响者,以便企业可以与个人建立更强的关系,他们可以就如何改进服务或产品提供更好的建议。

情感分析还可以帮助识别关于客户或潜在客户可能感兴趣的事物的重要趋势,以便企业改进其现有产品或创造新产品来满足这些需求。企业还可以利用情感分析来确定自己品牌可能受损的具体原因,比如等待时间长、质量差或者构思差。

这种人工智能技术也被用于企业和商业,以帮助了解和提高员工的士气和福利。在这个用例中,情绪分析可以分析员工有助于理解重要问题或管理人员变动对其可能产生的影响的职位。

更复杂的情绪分析应用程序使用人工智能来理解声音和面部表情传达的情绪。这种分析可以帮助识别支持电话中的情绪变化,或者评估客户对商店货架上新产品的看法。网飞甚至试图利用面部表情情感分析来改进电影预告片。然而,一些研究人员警告说,情感分析的这些应用可能会受到可靠性、特异性和普遍性问题的影响。