在遂昌县仙侠湖畔的“天工之城”,一支年轻的创业团队扎根于此,投身于一场融合科技与文化的先锋创业实践。
他们以声音为媒介,将人工智能与非遗传承、乡土资源巧妙嫁接,在绿水青山间探索着数字时代的文化表达新范式。
前不久,他们的项目《基于AI合成语音技术下儿童教育与陪伴产品的创新推广》,从2024中国国际大学生创新大赛中脱颖而出,一举夺得研究生创业组国家级金奖。
短暂的喜悦过后,他们马不停蹄地投入新一轮创新。这一次,他们要证明,在日新月异的科技浪潮下,只要敢于想象、勇于实践,“声音”能幻化出无限可能。
大山里开辟声音赛道
步入位于遂昌县湖山乡的此声文化科技有限公司,初看之下,这家企业并无特别之处。与想象中堆满高精尖设备的公司相比,它甚至显得朴素。
然而,随着了解的深入,会发现这朴素背后的人工智能,正带领着他们走向广阔无垠的旷野。在这个每天都在刷新效率值的维度里,思维的创新程度决定了产业天花板的高度。在“此声科技”,人就是发展最大的变量。
学生气,是“此声科技”总经理户鹏飞给人的第一印象。初见时,很难想象这位27岁的年轻人,竟已有5年创业经验。随着AI浪潮席卷而来,“年轻即资本”的含金量愈发凸显。户鹏飞始终热爱并坚守的声音产业赛道,也迎来了新变革。
声音经济,这个看似陌生的概念,近年来迎来了迅猛发展。有声书刊、播客等传统形式,只是这一赛道的初始版本。随着AI合成语音技术的不断迭代升级,声音产业的产能已大幅提升。
在“此声科技”的一面白墙上,写着公司在2023年成立之初时的简介,其中提到当时已有20万分钟的有声产品。如今,他们的有声产品已超过100万分钟。
这面墙的对面,挂着一块块亚克力宣传板,上面展示的是“此声科技”过往创作的有声产品,内容涵盖博物馆藏品讲解、地方特色文化介绍等。只需打开手机NFC功能,轻轻触碰板上的内置芯片,便能听到相应的音频内容。这些声音大多不是人工录入,而是通过AI合成语音技术制作的。
“过去,制作一段半小时的音频内容需要1小时,而现在仅需一两分钟。”户鹏飞介绍道,人声提取技术效率也大幅提升,仅需10分钟的原声,便能生成无数音频内容,其合成音与真人录制几乎无异。
当更富效率的人工智能袭来、很多人都陷入自己是否会被替代的焦虑中时,户鹏飞对未来却充满了憧憬,“我等这一天,已经等了很久。”
尽管是播音专业出身,但他凭借本科阶段的理工科背景,早在2018年攻读研究生期间,便有了不同于传统艺术工作者的思考。作为江苏省研究生创新工程的项目负责人,他在AI合成主播面世之际,便主持了一系列脑科学实验。在真人播音员与合成语音的对比实验中,他发现,在情绪理解维度,真人语音优势明显;但在信息记忆测试中,两者的准确率差异很小。这意味着,合成语音在知识传递场景中,已具备替代性。
有了这一科学支撑,户鹏飞早早就开始为未来做储备。不仅在南京创立了公司,还逐步对接合成语音的前沿技术、储备各类声音素材。
得益于这一前瞻布局,当“声音”作为最古老的媒介之一,逐渐成为AI变革的核心载体时,户鹏飞的事业也迎来了蓬勃发展的春天。
在算法里找到情感温度
选择遂昌,户鹏飞还有另外一个理由。
2023年2月16日,在一位同样毕业于南京艺术学院的学长引荐下,户鹏飞第一次来到湖山乡。望着波光粼粼的仙侠湖,一种熟悉的感觉油然而生。在他的老家江苏省徐州市沛县户屯村,也有这样一个湖。
湖畔的生活承载了他童年的幸福记忆,唯一的遗憾是父亲因在外打拼事业,缺席了他的成长。在那个车马很慢的年代,年幼的户鹏飞只能通过父亲不定期的电话来填补这份遗憾。长大后,他离开家乡求学、创业,与父亲依旧聚少离多。直到现在,电话里父亲质朴的关心,依然温暖着背井离乡的他。
正是声音的力量,让户鹏飞选择了播音主持专业。读研期间,他萌生了制作儿童陪伴有声产品的想法。随着AI技术的成熟,内容生产效率大幅提升,也催生了“情感声创”这一全新场景。渐渐地,“基于AI合成语音技术的儿童教育与陪伴产品创新推广”项目应运而生。
这个项目在户鹏飞一次又一次的参赛中不断成熟,最终在仙侠湖畔迎来了首次落地实践。2024年8月,正值小学暑假,“此声科技”启动了《童话遂昌》暑期项目,着手从湖山小学筛选出合适的童声,以遂昌文化为内核制作一系列音频内容,同时让这些声音成为湖山和湖山人的永久陪伴。
经过层层筛选,4个孩子参与了项目。项目结束时,一个名叫曾雨晨的小女孩问项目负责人周苏仪:“姐姐,以后我妈妈也能用我的声音听故事吗?”周苏仪点头的瞬间,看到曾雨晨的眼睛闪烁着光芒。那一刻,她忽然明白了户鹏飞常挂在嘴边的那句话:“在冰冷的代码与算法背后,找到声音的温度。”
户鹏飞还记得今年年初,他在湖南卫视《夺金2025》节目中推介自己的项目后,一位来自四川的母亲找到他,希望用AI技术复刻离世儿子的声音。仅凭微信中一段嘈杂的语音片段,“此声科技”的团队迅速完成了降噪与声音重建,并以儿子的口吻为这位母亲留下了一段宽慰人心的话。
“科技不是冰冷的。”无论是地方文化的娓娓道来,还是人与人之间的深情告白,科技让声音变得更加生动、更具感染力。这种技术与情感的融合,不仅提升了用户体验,也让声音经济在数字时代焕发出强大的生命力。
激活在地资源的“数字新生”
对“此声科技”而言,2024年是破茧成蝶的关键年份。最近,户鹏飞四处奔波,希望将声波转化为数字刻刀,以独特方式赋予遂昌传统文化一种新的生命形态。
眼下,在这片土地上,一场关于文化基因的数字编码实验悄然展开——那些沉睡在古籍中的戏曲唱段、散落在乡间的非遗故事,正在被重新编译成可存储、可交互、可生长的数字生命体。
在户鹏飞的工作台上,一枚跟指甲盖差不多大小的芯片折射出科技的诗意。这个厚度仅1毫米的微型载体,能存储超过1小时的声音内容,每年支持1000次播放。而这些数字作为文创赋能的手段,已能满足绝大多数应用场景的需求。“这相当于把文化基因封装进数字琥珀。”他轻轻捏起芯片对准光线,金属表面流转的微光仿佛闪耀着文化的魅力。
这些“文化琥珀”将被植入明信片、冰箱贴等文创产品,或者汤显祖IP的玩偶里。被芯片赋能的“有声文创”可以描绘的画卷远不止眼前所见,更丰富的文字、声音、图片、视频乃至场所的定位,都可以在眼前一一展开。当用户用手机等电子设备轻触NFC感应区,即可触发多重文化声场:童声演绎的文化解读、非遗代表性传承人原声讲述的民俗故事、专业声优演绎的汤显祖《牡丹亭》选段、AI重新编曲的婺剧经典唱腔等。“我们不是要取代纸质导览,而是创造‘耳畔博物馆’。”周苏仪说。
更具突破性的实验发生在AI交互领域。在“此声科技”的设想里,以汤显祖系列玩偶为载体,不仅可以为其定制“声音IP”,还可以搭载大模型使其实现有声互动。比如当游客问“杜丽娘为什么游园惊梦”时,玩偶不仅可以即时回答,还能带来戏曲哼唱等才艺展示。
这些创新背后,藏着更深层的文化逻辑。在遂昌,声音正悄然改变文化传承路径。比如,孩子们的声音讲述的民间故事,经过AI降噪、修复后存入云端声库,未来将成为文旅导览的个性化选项。“我们不是在用科技改变文化,而是让文化借助科技重生。”在户鹏飞看来,借助声音对文化进行“活态传承”,可以让文化记忆在数字空间持续生长。
扎根湖山乡的“此声科技”,正将根系延伸向更深处。户鹏飞构想着未来的场景:“从丽水起步,从浙西南辐射到长三角,我们希望编织一张连接过去与未来的网,让科技和艺术的声音成为文化的另一种打开方式。”更远大的蓝图里,“声创+”模式将突破文旅边界,在乡村振兴、情感疗愈、国际传播等领域开辟广阔舞台。
当老艺人的吟唱在芯片中永生、当童声故事在云端代际传递、当AI戏腔在毛绒玩具里焕新,“此声科技”的敢想敢做也揭示了一个数字时代的生存法则:真正的传承不是将过去制成标本,而是让传统文化获得数字化的生命体征。
当然,在这条没有终点的创新之路上,比技术突破更珍贵的,始终是那些在声波中永续跳动的文化基因,以及科技向善的永恒追求。