第166章 算法的饥渴与数据的围城(2 / 3)
多的是技术层面的焦虑,“现有的数据量和多样性,已经无法支撑下一代交互模型的训练。
我们需要更大量、更多样化、更高质量的脑电数据,否则‘星曦u1tiate’的体验突破无从谈起。”
她详细解释了当前模型遇到的困境,以及她对所需数据规模和类型的估算。
最后,她强调道:“最关键的是,这些数据的获取,必须在绝对合规、尊重用户隐私的前提下进行。
这很难,所以我需要公司的帮助。”
林烨身体前倾,手指交叉放在桌上,神情变得严肃起来。
他非常清楚数据的重要性,更深知数据隐私是一条绝对不能逾越的高压线。
星火科技之所以能走到今天,技术和口碑是立身之本,而用户信任则是口碑的基石。
他沉思了片刻,没有立刻回答李晶关于数据的具体问题,而是拿起内部电话:“李文,你现在来我办公室一趟。”
很快,知识产权与法务总监李文拿着一台平板电脑快步走了进来。
她是一位气质干练、思维缜密的女性,对国内外数据安全法规了如指掌。
“李总,坐。”
林烨示意了一下,然后将李晶面临的困境和需求言简意赅地转述了一遍,最后问道:“从法律和合规角度,我们有多大操作空间?如何在保护用户隐私的前提下,合法合规地获取李工需要的研究数据?”
李文推了推眼镜,几乎没有思考,立刻条理清晰地回答:“林总,李工,这个问题我们法务部之前做过预研。
大规模收集脑电生物数据,敏感度极高,我们必须遵循几个核心原则:最小必要原则、用户知情同意原则、数据脱敏匿名化原则、用途限定原则以及严格的安保存储原则。”
她打开平板,调出几份文件:“直接面向公众无差别征集,风险极大,且成本高昂(用户教育和合规成本)。
我认为,目前最可行的路径有以下几条:
”
第一,与顶尖高校和科研院所建立深度合作。
他们本身有伦理审查委员会,有长期进行人体实验研究的数据采集经验和合规流程。
我们可以以科研合作项目的形式,资助他们进行特定方向的脑电研究,在获得受试者充分授权的前提下,共享脱敏后的匿名化数据。
这是目前最稳妥、最合规的方式。
”
第二,启动严格的‘用户研究志愿者’计划。
在我们现有的用户群体中,筛选出一批高度认同星火理念、愿意为技术进步贡献力量的‘级用户’,经过严格的告知和层层授权(包括明确告知数据用途、风险,并允许其随时无条件退出),邀请他们参与更深度的数据采集项目,并给予足够的激励(非单纯金钱,可以是独家体验、荣誉身份等)。
”
第三,探索‘联邦学习’等隐私计算技术。
让模型去用户那里‘跑’,而不是把数据拿回来。
数据始终留在用户本地设备上,我们只获取加密后的模型参数更新。
但这需要对现有产品架构和算法框架进行较大改造,且对数据多样性有一定要求,可以作为长期技术储备。”
李晶听得非常认真,李文提出的几条路径,尤其是前两条,为她打开了新的思路。
这不再是单纯的技术问题,而是一个需要技术、法务、市场甚至用户运营共同协作的系统工程。
林烨听完,做出了决断:“好。
李文,你负责牵头,立即组建一个跨部门小组,成员包括法务、算法、市场、用户运营。
就按照你刚才说的思路,尽快拿出一个完整的、可执行的‘星火脑电科学研究数据库’建设方案。
方案必须把合规性和用户权益保护放在位,任何环节都不能有模糊地带。”
他看向李晶:
↑返回顶部↑
温馨提示:亲爱的读者,为了避免丢失和转马,请勿依赖搜索访问,建议你收藏【格格党】 www.g3zw.com。我们将持续为您更新!
请勿开启浏览器阅读模式,可能将导致章节内容缺失及无法阅读下一章。