北京字典价格联盟

人工智能的突破点

只看楼主 收藏 回复
  • - -
楼主

前言

        人工智能包含很多方面,广义的人工智能是机器人能够代替人做任何事情,而狭义的人工智能是机器人能够处理一个问题。人工智能机器人与环境互动的过程中需要交流,这样才能获得信息,知道对方的需求,就在交流的过程中,人工智能一个很大的问题便暴露出来– 语言。 机器人如何了解人类给他们下达的命令?最直接的方式便是跟它们对话,告诉他们去干什么。



图灵(选自电影截图)

图灵测试 

        上世纪五十年代,人工智能之父图灵曾经提出过一个智能化程度测试“图灵测试”,大概过程就是在一个房间里面有一个电脑程序和一个人,房间外面的人只能通过另一个电脑跟房间里面的电脑程序或者人取得文字交流(外面的人问问题,里面的人或者计算机回答问题),但是他不知道房间里面回答他问题的是电脑还是人,外面的人可以问各种各样的问题来测试里面的人或者电脑,如果一系列问题过后,外面的人根本分辨不出回答他那些问题的是电脑程序还是人,那么这个电脑程序就通过了图灵测试,也可以认为电脑程序能够思考了。


图灵测试卡通图

从提出到今天六十多年过去了,仍然没有一个计算机程序能够通过这个测试,如果某个计算程序能够通过这个测试,那么必将被载入人工智能的史册。



咿呀学语的小孩

语言的难点

    一旦涉及到文字,这个就会很难,为什么呢?可能我们平时没有这个感觉,因为我们从2~3岁就会说话了,从一开始喊爸爸妈妈,到初中认识了几千个字,并且熟练掌握了语言的语法,语义。但是要想让一个电脑能够识字,并且能够像人一样灵活自如的运用,目前来看还是没法实现。难点有以下几个


1. 识字,理解和归纳(没有任何学习过程,光存数据)

        对于识字,目前来说,计算机还仅仅是停留在储存对应的字或者词,相应的意思也会储存下来。如果在电脑词典里面查询字或者词的意思,它会从它的数据库里面调用之前存好的意思显示出来。在这个过程中,没有任何学习的过程,仅仅是储存数据以及数据的调用。百度“计算机”的搜索结果中解释道:“计算机(computer)俗称电脑,是一种用于高速计算的电子计算机器,可以进行数值计算,又可以进行逻辑计算,还具有存储记忆功能。是能够按照程序,自动、高速处理海量数据的现代化智能电子设备。由硬件系统和软件系统所组成,没有安装任何软件的计算机称为裸机。可分为超级计算机、工业控制计算机、网络计算机、个人计算机、嵌入式计算机五类,较先进的计算机有等。”,但是你如果想要更加简单的解释,它就没法生成,即使手动编写一些程序来生成短语,也没有通过理解和学习的过程,程序怎么写,它的结果就会使怎么出来,没有任何进步和学习的空间。

 

2. 语法和句子结构

        目前计算机对语法的理解也仅仅限制在程序员手工输入的层面,简单的来说就是事先写好的程序,用的时候就是一个一个套用。用到的计算机术语是if和else,当某个条件满足时执行if下面的代码,当某个条件不满足是就执行else下面的代码,然后else下面又可以嵌套很多层if,else。下面举个例子:


这个例子中间的句子是“我爱妈妈。”,通过if,else条件判断就能够判断出这三个词“我,爱,妈妈”在句子中间的成分分别是“主语,谓语,宾语”。这个例子还不能执行,仅仅是给大家举一个例子。这种方法需要大量的人工劳动力来写代码以及做后期的代码改进和纠错。

 

3. 字的意思(同义词,一词多意)

        识字的过程中第二个问题就是同义词以及一词多意。电脑根本没法理解和区分这中间的不同。比如:毛主席,,,指代的都是同一个人,电脑不知道什么时候什么场合该用哪个代词。说到一次多意,中文的博大精深就展现的淋漓尽致了,下面从网上摘抄了一小段供大家看看:


春节期间收到一条关于“意思”的短信,很,特转录如下:
某老外苦学汉语十年,到中国参加汉语考试,试题为“请解释下文中每个‘意思’的意思”:
给领导送红包时,两人的对话颇。领导:“你这是什么意思?”:“没,意思意思。”领导:“你这就不够意思了。”:“小意思,小意思。”领导:“你这人真有意思。”阿呆:“其实也没有别的意思。”领导:“那我就不好意思了。”阿呆:“是我不好意思。”老外一脸茫然,不知如何作答,只好交白卷回国。

         

        老外还是人类,对这个一词多意就已经是搞不定了,如果换做是计算机,答案就可想而知了。


4.非常规的用法(讽刺,俚语)

        讽刺可以用在各种各样的地方,电脑很难判断,比如,某女评论某渣男:“他真帅!!!”,电脑得到的信息里面根本就跟丑没有任何联系,这个需要从背景里面提取信息。还有很多俚语也没有被电脑收录,电脑对于这些信息也是无从下手。

 

5. 不同语言之间的语法差异

        不同语言之间的语法差异也是有大有小,比如中文里面说的“我吃饭”,换做日语就成了“我饭吃”,谓语和宾语的顺序直接就颠倒了,这个也给计算机语言处理带来很大的问题。

不同语言的‘我爱你’
 


6. 回答问题

        对于问题的理解很重要,简单的问题还好,比如只需要回答是或者不是的问题(一般疑问句):“你是帅哥吗?”,但是一旦到了稍微复杂的一些的问题,计算机根本不知道答案的形式是什么样的,比如:“我觉得我上司做的不对,他不应该让我在业余时间工作,这个犯了法,是什么法?”要让人来回答问题的话,人会百度劳动法,然后在里面找相关的条例,但是计算机恐怕很难,它需要理解整个句子的来龙去脉。首先,它需要知道“这个犯了法”中间的这个指代什么,指代“我觉得我老师做的不对”?还是“他不应该让我在业余时间干活”?,找到了指代的对象以后,还得知道什么是“犯了法”?等等,很多我们人觉得很正常的事情,计算机根本就摸不着头脑。


人工智能已经解决的问题

        目前计算机能够处理或者部分处理的问题包括以下:

  1. 词性的判定(名词,动词,介词,副词,形容词等等)

  2. 部分简单结构的判定(主谓宾)

  3. 双语翻译

  4. 一次多意的歧义区分

  5. 字数统计,词频统计

  6. 查找和替换


 小结

        语言处理方面的技术做的比较前沿的是斯坦福大学自然语言处理实验室,他们目前的工作也仅仅局限在小编刚刚讨论的几点上面,距离人类还很遥远。国内也有一些大学在做自然语言处理包括:北京大学,复旦大学,黑龙江大学等等。

        国内自然语言处理方面的APP也有一些,比较出名的有微软小冰和出门问问,不过也都仅仅停留在起步阶段,微软小冰通过搜集网上的对话,用来回答问题,只能作为一部分人无聊时候消遣的工具,不能作为学习或者工作当中的工具;出门问问,也仅仅只是语音识别外加基本的语言处理,语言处理的问题仅仅局限在“发短信给某某,查找某酒店,我要去哪”这些固定结构的语句,局限性太大。距离真正的商业化作用的发挥还有很长的路要走。

微软小冰




日笃小站为您介绍日本的制造业及最新科技

长按上面二维码,即可关注日笃小站



举报 | 1楼 回复

友情链接