在科技飞速发展的今日,人工智能(AI)已成为推动医疗健康发展的重要力量。台湾作为一个科技与医疗兼备的国家,如何利用AI技术提升公共健康,一直是研究者和政府所关注的议题。在这样的背景下,g0v零时小学校的「繁体中文AI开源实践计画」应运而生,旨在支持具有高度透明度、重用性和永续性的Gen AI专案。
2024年3月4日,该计画宣布了最新一轮的入选专案,其中由亚洲大学 精准健康研究中心的 蔡志仁组长领衔的「大量阅读台湾研究的健康促进小帮手」项目脱颖而出,成为众多申请项目中的佼佼者。
该专案的核心目标是利用AI技术,整理和蒐集全台医疗院所发布的高度透明和可信的健康促进资料,包括文字、图片和影片等多模态资讯。透过先进的GPT-4和Gemini技术,项目将实施高品质的数据过滤机制,提炼出可供重用的高品质开源资料集,进而训练各种开源大语言模型(LLM)。
蔡志仁组长表示:“我们的目标不仅仅是为了今天,更是为了未来。透过建立一个高品质、可靠的开源资料集,我们希望能够为繁体中文AI模型的发展做出贡献,推动台湾乃至全球的健康促进研究。”
该专案的实施将采取阶段性进展。首先,团队将针对全台医疗院所进行广泛的网络搜寻,以确定有效的网址。随后,根据网页结构调整程式码,自动下载卫教相关的资讯,包括文字、图片、影片及出处等。这一步骤的完成,将为后续的资料分析和整理打下坚实的基础。
接下来,利用GPT-4和Gemini的先进API,团队将对收集到的资料进行深度分析,从中提炼出精华内容并制作出详细的辅助说明、总结或结论。这一过程不仅能够提高资料的可用性和价值,更能够确保最终生成的资料集在质量和可靠性上都达到最高标准。
最终,该项目将生成一个符合开源规范的MiniGPT-4多模态大语言模型所需的多模态资料集,并计划将其公开分享,供g0v零时小学校以及广大的研究者和开发者使用。这不仅能够加速相关领域的研究进展,更将促进健康促进相关应用的创新和发展。
蔡志仁组长强调,这个项目的成功将是台湾AI研究与开发领域的一大里程碑。透过这种开源共享的方式,可以极大地促进资讯的流通和知识的累积,从而推动整个社会的进步。
g0v零时小学校的繁体中文AI开源实践计画的负责人也表示,他们对「大量阅读台湾研究的健康促进小帮手」项目抱有极高的期望,相信其最终成果将对提升公众健康、推动AI技术的发展以及促进开源文化的扩散产生深远的影响。
随着该计画的进一步实施,我们期待「大量阅读台湾研究的健康促进小帮手」能够为台湾乃至全世界的健康促进和AI研究领域带来更多的创新和突破。
随着这个项目的进展,公众将有机会见证AI技术在健康促进领域的巨大潜力和价值。此外,「大量阅读台湾研究的健康促进小帮手」项目的成功实施也将为其他研究者和开发者提供一个重要的参考模板,展示如何有效地利用开源大语言模型和多模态数据集来解决实际问题,特别是在公共卫生领域。
这一项目不仅仅是技术的展示,更是一次对社会责任的承诺。通过将这些资源开放给公众,项目组希望能够激励更多的人参与到健康促进和AI技术的研究中来,从而共同推动社会的健康和福祉。
值得一提的是,该项目的开源性质将大大降低进入门槛,使得无论是学术界还是业界的研究人员,甚至是对AI和健康促进感兴趣的普通公众,都能够轻松获取和利用这些资源进行研究和开发。这不仅能够促进跨领域的交流和合作,更能够加速创新的步伐,为解决全球健康问题提供新的思路和方案。
随着项目进展和成果的不断累积,我们有理由相信,「大量阅读台湾研究的健康促进小帮手」将成为台湾乃至全球健康促进领域一个重要的里程碑。它不仅将推动健康促进的研究和实践走向更高的水平,也将为全人类的福祉作出积极贡献。
我们期待看到这一项目在未来的发展,并相信它将为我们带来更健康、更美好的明天。
图1、大量阅读台湾研究的健康促进小帮手