如果你在宋伟面前吐槽,人类期待机器人可以扫地、洗碗、叠衣服,可它们偏偏在写诗、画画、跳舞,他会笑着让你再等等,心烦的话可以听一听由他组建的机器人乐队的表演。
弹钢琴、敲架子鼓、吹管乐……一个多月前,这支名为“和璇”的乐队在杭州西站完成了一场大秀,已经收到来自四面八方,包含人类乐队的邀请,会的曲目也越来越多,从《歌唱祖国》到《沧海一声笑》《青花瓷》《孤勇者》。
宋伟为那场表演打了优秀分,“机器人的完成度很高,就是选曲、编排等有些难为我们这一帮工科直男了”。
这位浙江大学研究员,和云深处创始人朱秋国是本科同班同学,算是国内最早一批在人形机器人领域的拓荒者,而且选择了一个颇为浪漫的切入口:弹钢琴。
出道数月的和璇乐队
一台开了侧盖的电脑主机静置在地,墙角放着一张单人折叠床;带鱼屏显示器上,是一份未完成的PPT,求职简历和博士、硕士毕业论文整齐地摞在一旁;玻璃窗上贴着两个透明挂钩,外套和双肩背包往那一挂,人便可转身扎进代码与算法的世界。
走进宋伟的办公室,一眼就能看出他多个身份。
这里是位于浙江大学校友企业总部经济园的浙大机器人研究院,也是杭州海创人形机器人产业创新中心所在地。后者是去年8月,浙大与余杭区政府合作共建的重大科创平台,由浙大原党委副书记、机器人研究院院长朱世强担任主任。
他也是宋伟求学以及职业生涯非常重要的导师。
约到这次采访并不太容易。宋伟太忙了:技术研发、团队管理、访客接待、宣传推广……
这个团队眼下最亮眼的成果之一是“和璇乐队”,从钢琴、扬琴、架子鼓,到训练中的吹管、无弦吉他等,“技能树”正在不断点亮。
和人一样,钢琴机器人左右“手”各有五根“手指”,可精准敲击黑白键,且能较快切换,“脚”还会随着节奏轻踩踏板。
再加上扬琴机器人和架子鼓机器人,和璇乐队已“出道”数月,在各大科技展馆、社区和商场完成了几十场演出。它们不会抢拍,也不会弹错音符,俨然是训练有素的“乐手”。
机器人与人类弹奏仍有本质区别。现阶段,机器人靠的是灵巧手与机械臂的精密配合。人类为它预设程序、导入乐谱,再通过曲谱解析算法、运动控制算法,将每一个音符转化为精准的指法动作。
弹钢琴是为了更好地洗碗?
让机器人弹琴这件事,人类已经认真研发了好久。2017年,一台名为Arpeggio的钢琴机器人面世。它拥有夸张的88根“手指”,可以精准控制256种踏板和1000多种琴键。只要提前编程设置好,无论是哪一首名曲,难度有多高,都可以信手拈来。
但如果把“手指”缩减到跟人一样的数量,机器人还能那么从容吗?这是摆在宋伟他们面前的一道难题。
对于为什么要做弹琴机器人,宋伟他们有着清晰的认知。首先,相比让机器人倒杯水,音乐演奏是一个复杂的场景,而且考验的是“双手”能力。其次,像倒水这件事,只是让机器人关注东西在哪里,更多考验的是视觉捕捉能力。
“但弹琴是有节拍概念的,你既要在这一时刻找对位置,又要注意下一步怎么弹。这就是前瞻性。它在时序上就比倒水更复杂。”宋伟表示,弹琴考验的不仅是手,还有手臂的协同,需要机器人在演奏时身体各部位和人一样保持和谐。
和人类学琴有考级一样,随着演奏曲目难度的增加,对机器人的考验也越来越大。目前,宋伟和团队以演奏技巧、可演奏曲目的复杂程度,来对机器人演奏水平进行评级。这些指标都可转化为对手指跨度、移动速度等手臂能力的量化目标。
“随着演奏等级的提升,手和臂的智能化也在进步,技术方案由此实现持续迭代。”而当这些技术打磨成熟后,再让机器人做一些扫地、洗碗、叠衣服之类相对简单的事就属于“降维打击”。
来自浙大的技术基因
“从技术的视角来看,仅去年到今年,人形机器人在运动控制方面的突破,可能已经超越过去20年的总和。”谈及近几年技术的飞跃,宋伟的语气中流露出些许感慨。
他与机器人的故事,开始于22年前。
2003年,宋伟从山东考入浙江大学机械电子工程专业。“男生嘛,都差不多,从小爱看机甲动画片,对机器人有发自内心的热爱。”他笑着回忆,“所以就报考了机械电子工程专业。”他的同班同学中,就有后来创办云深处科技的朱秋国。宋伟办公室的小圆桌上,刚好还放着朱秋国最近赠送的《智能四足机器人Lite3实训案例集》签名本。
此后,两人都选择留校深造。宋伟进入流体动力与机电系统国家重点实验室攻读博士,朱秋国则进入控制科学与工程学院师从褚健和熊蓉教授。
彼时,机器人研究的火种已开始在浙大校园里播撒,如今开枝散叶、星火燎原。除了宋伟、朱秋国,还有熊蓉教授和宁波市政府共建的浙江人形机器人创新中心、王宏涛教授的镜识科技、王酉副教授的逻腾科技……这些带着浙大师生基因的创新力量,正在机器人领域的不同赛道探索前行。
早些年,宋伟的研究聚焦于特种作业机器人,例如无人自主爬壁机器人和深水软体作业机器人,“看似领域不同,但底层技术其实是相通的”。直到2018年,新型研发机构之江实验室的成立,让他有机会成为国内人形机器人拓荒者里的一员。
错过这个风口要再等20年
在音乐演奏机器人研发的道路上,宋伟为团队勾勒出更富挑战性的新目标:持续增强表现力与智能水平。新开发的机械臂演奏能力更强,也更灵活,“外观还会继续打磨,加入肢体动作。接下来还会引入AI技术,先实现人机交互,再让AI生成曲谱,曲库与动作已经打通。一旦AI能够写歌,真正的交互性体验就会实现”。
“目前算法其实是跑在硬件前面。仿真系统里可以实现的演奏动作,但现实是有时硬件的性能与可靠性还不够。”团队只能在算法上找补,同时自主研发高性能关节。
眼下,机器人乐队学会一首新曲需要多久?
答案是一天左右。为什么不是半小时、十分钟?“还是硬件问题,性能没跟上。”
回想起8月在杭州西站办的那场“机器人梦想之夜”音乐会,宋伟语气中透着自豪。长达两小时的演出,有机器人乐队独奏,也有人机协作环节,很大程度上依赖于高精度的程序控制,他认为团队完成得“非常出色”。“当机器人与竹笛演奏者合作《青城山下白素贞》,那种默契与氛围呈现的最终效果,还是挺打动人的。”
在宋伟的设想中,机器人乐队更可以成为人类音乐人的创作伙伴。当然,“硬件需要更稳定,算法也要更智能”。人类一个眼神,机器人就明白要弹什么;曲风骤变,它也能即刻跟上,这是他心中理想的协作状态。
生活中的宋伟喜欢晨跑,常常在早上六七点出发。最近一次跑完,他发了条朋友圈:照片里是一人一狗散步的背影,配文写道:“似乎看到了自己未来的老年生活。”
不过显然,当下的他根本无暇考虑退休。就像他和团队成员说的:“如果抓不住这次人形机器人的技术风口,也许就要再等20年。一旦抓住,一切都会迎来飞跃。”