用地球上已有的技术,要如何造出一个能在视频会议中出现的虚拟人?要能听懂别人说啥,需要语音转文字、语义理解的技术。
本文经AI新媒体量子位(大众号ID:QbitAI)授权转载,转载请联络出处。
上一辈的老人在厨房预备香馥馥的食物,下一辈的孩子在一旁快乐的玩游戏和玩具,只要你,上半身穿着光鲜头发规整,下半身穿着睡裤光着脚,在视频会议软件里人模狗样,敷衍一个接一个无聊的会议主题。
天道有轮回,现在轮到Work from Home的歪果公民被视频作业逼疯了。
乃至有人吐槽:
咱们活在Zoom发明的虚拟国际里,一天到晚都在Zoom中日子。
你认为在家作业能够回归日子了,实际上只是在Zoom里模仿人生。
那,能不能“下线”摸鱼?
会被老板发现。
不如体面点,造个机器人替我开会,我自己去撸猫猫玩动森。
好主意,美国一位叫Matt Reed的老哥说干就干,造出了专用于Zoom开会的替身:
Zoombot,Zoom机器人,已开源,可试用,操作简洁,流程一点都不杂乱。
怎么造出虚拟的我
用地球上已有的技能,要怎么造出一个能在视频会议中呈现的虚拟人?
要能听懂他人说啥,需求语音转文字、语义了解的技能;
要能回应他人的话,需求具有多轮对话和TTS才能;
说话的时分还得对口型和表情,需求用到GAN;
并且评论的是作业相关问题,需求预备作业相关事务范畴的常识图谱;
假如开会的时分你不在,还需求总结下开会说了啥,老板有没有给自己安置新的使命,需求一个概括总结的自然语言生成体系;
……
并且,作用一定要传神,不能出纰漏被老板发现。
天,假如懂得这么多技能,为什么还要上班,自己创业不好嘛?
Matt也不理解这么多,所以他采用了最简略粗犷的方法:
把自己的视频录下来,再一句一句设定好回复。
横竖“职场黑话”就那么几句,总有人靠“嗯嗯”“好的”“稍等”打天下。
所以Matt就用录屏软件把自己在电脑前的形象录下来,他用的是Mac的QuickTime录屏,然后设定回复:
-“你好吗?”
-“谢谢您关怀。”
-“你理解了吗?”
-“我听不太清。”
-“拜拜!”
-“嗯嗯,咱们之后再聊,我们注意安全。”
之后,设置一个虚拟网络摄像头,然后把Zoom的输入设置为这个虚拟网络摄像头,这样开视频会议的时分,传到搭档们电脑里的视频就不再是摄像头当场录制的内容,而是Matt提早录好的视频了。
这样,有视频,有声响,一个开会机器人就完成了。
莫非是担任搞笑的?
现在你或许有点置疑了:
就这?真能瞒天过海么?当老板是傻子吧?
Matt在和搭档开会的时分试了试,搭档们都笑疯了:
确实主动回复了,讲话还很活跃,但是这一帧一帧的作用、一个词一个词往出蹦的声响,似乎是个文娱产品哈哈哈哈哈。
不得不说,这位Matt老哥,简直是摸鱼界的姜太公、职场稻草人、嘲讽老板大会小会开不断的榜样!
见过那么多机器人,这位真是绝无仅有独领风骚名列前茅。
出品方竟然是个广告公司
所以,用这个开会机器人欺骗老板的Matt,现在赋闲稳妥领到了么?
你想多了,他但是一位连Ian Goodfellow都在重视的技能派构思达人。
便是不知道“好人”Goodfellow会不会给他辅导一下,把GAN参加进来让开会机器人的视频更流通。
Matt的这个搞笑的开会机器人,其实是他作业的一部分,他在一家名叫“红胡椒(redpepper)”的构思公司担任构思技能专家。
△ 这个运用椅子的姿态挺有构思的
翻译一下,“构思公司”大部分是“供给很有构思的计划的广告公司”,比方你们了解的那家以“开车”广告出名的日用产品,这些“开车”的构思就来自于广告公司环时互动。
所以,别看Matt发明了这么搞笑的奇特玩意儿,人家是在正派作业。
比方说,他们一度真的把NLP模型GPT-2胡编的那些菜谱给做成了菜。
GPT-2:
炸玉米马铃薯披萨,主厨小Ed Berger最近抓住了这个马铃薯披萨菜谱,它会很快乐知道它对你也有吸引力。干得好,主厨。作为开胃菜,把它们和4片切片草莓放在桌子上,然后一同吃。
红胡椒团队:
GPT-2:
?????????????????(这是菜名)
切860个洋葱,切成薄片
切芹菜碎末,切成薄片
香醋,打碎
醋盐,加一小撮辣椒
中草药,最好是刺山柑
50克非乳制奶酪+糖蜜
给最底下的底层或马铃薯调味
营养成分:3400磅科尔多瓦
每份容量;17.1美元甲氧西林1/2苹果,粗磨
红胡椒团队:
尴尬他们了,这洋葱缩水有点严峻。
传送门
最终,不瞒你说,这个搞笑的项目现已开源了。
需求的朋友(假如有),能够去GitHub自取:
https://github.com/mcreed/Zoombot