一般我不会说自己是做自然语言处理(NLP)的,因为大部分人都不知道那是什么。大多数人提到AI,只知道是人工智能。他们想的都是阿尔法围棋打败李世石或者其他和机器人有关的事情。其实机器人只是人工智能的一个小分支。看看下面这张图,出自石忠志主编的教材《人工智能》。这张图展示了与人工智能相关的学科以及人工智能的研究和应用领域。我现在的方向是语言与图像理解,相关学科是数学。我现在做的事情需要坚实的数学基础做支撑。说说自然语言处理中最简单的东西:语言模型。语言模型就是学习人类自然语言,模仿人类说话。比如我们平时用的输入法,你输入一个单词后,他会给你提示下一个你可能需要的单词的内容。
在语言模型学习的过程中,就像孩子学说话一样,不断获取句子,学习什么单词最有可能跟在单词后面。这样,当我们训练一个有用的语言模型时,就可以让它帮助我们说话。现在非常流行的语言模型,比如GPT-3等等。NLG对NLU自然语言处理有两个重要的分支:自然语言生成(NLG)将文本的潜在表示转换成具体且自洽的自然语言文本。自然语言理解(NLU)对输入文本进行消歧和概括,以获得能够表达文本中心思想的标准化表示。一般来说,自然语言理解的目标是让机器能够更好地理解人说的话,但自然语言生成的目标是让机器能够像人一样说话。自然语言生成应用广泛,如对话系统(各种聊天机器人)、数据增强、故事生成等等。我想起我们之前做的一个工作,就是控制细粒度情绪的产生。然后我们思考了应用前景。我:那么控制文字生成的情绪有什么意义呢?做水军?看一些简单的文本生成示例:
故事生成第一个例子是故事生成,给模型一个段落。模型是根据这一段的故事线关键词生成的。要求生成的内容应符合这些关键字,米乐M6 M6米乐并按关键字给定的顺序生成。给文:今天吃甜品好开心,感觉好幸福。故事线:开心→好开心这里有一些句子给你:今天,我最好的朋友给我煮了粥。我太高兴了。我很开心。×这就乱套了,这样的故事生成器不达标。我很高兴见到你。我觉得好开心。√使用规定的单词,并按正确的顺序。这是一个很好的故事发生器。打开这个猪心,我们可以看到里面的瓣膜,(闻闻),好腥,我服了。×这种故事生成器不是狗用的!!!但是如果我们仔细观察左边的图片,我们会发现它与我上面说的不太一样,因为它:约翰需要一台电脑作为生日礼物。米乐M6 M6米乐他努力工作赚钱。约翰有能力买他的电脑。他去商店点了一只电脑。之三。约翰对他的新电脑很满意。(约翰需要一台电脑作为生日礼物。他努力工作赚钱。约翰买得起他的电脑。他去商店买了一台电脑。约翰对他的新电脑很满意。)这个男人非常高兴,米乐M6 M6米乐因为他买了一台新电脑。他去了商店。他需要一台电脑。他买了这台电脑。他安装了电脑。可以看出,虽然是用关键词生成的,但好像并不是按照其要求中所写的关键词顺序生成的。聊天机器人右边是对话文本生成的例子,我们可以看到对话内容。机器人的第二句话是回复最后一句话,回复的方式有几千万。如果是坏朋友,可以抽根烟帮她减压。如果渣男能回复“……”或者乱码,说明他无语,不想说话。如果是好朋友,就要认真的去缓解和安慰她。你让聊天机器人变得讨厌了吗?不会,所以你要防止第一条和第二条回复,也就是不要产生有毒的数据或者无效的文字回复。米乐M6 M6米乐这涉及到受控的文本生成,这也是我目前正在做的事情。以后有机会再讲。说最后一句题外话,多轮对话不能只回复现在的句子,还要考虑之前的内容,所以对话生成年的一个热点就是多轮对话。感觉天猫精灵很多轮对话都可以做(天猫精灵马上就要给我钱了)。有天猫精灵的朋友可以试试,喊完天猫精灵再喊一个小爱同学。标签最后,我是洛里安。我是搞人工智能的。更具体的说,叫自然语言处理,更具体的说,叫文本生成,更具体的说,叫可控文本生成。
电话:13644723777
传 真:+86-173-4169
手 机:13644723777
邮 箱:mile@nmgdp.net
地 址:内蒙古包头市昆区昆工路光彩商业街99号