在科技飛速發展的今日,人工智慧(AI)已成為推動醫療健康發展的重要力量。台灣作為一個科技與醫療兼備的國家,如何利用AI技術提升公共健康,一直是研究者和政府所關注的議題。在這樣的背景下,g0v零時小學校的「繁體中文AI開源實踐計畫」應運而生,旨在支持具有高度透明度、重用性和永續性的Gen AI專案。
2024年3月4日,該計畫宣布了最新一輪的入選專案,其中由亞洲大學 精準健康研究中心的 蔡志仁組長領銜的「大量閱讀台灣研究的健康促進小幫手」項目脫穎而出,成為眾多申請項目中的佼佼者。
該專案的核心目標是利用AI技術,整理和蒐集全台醫療院所發布的高度透明和可信的健康促進資料,包括文字、圖片和影片等多模態資訊。透過先進的GPT-4和Gemini技術,項目將實施高品質的數據過濾機制,提煉出可供重用的高品質開源資料集,進而訓練各種開源大語言模型(LLM)。
蔡志仁組長表示:“我們的目標不僅僅是為了今天,更是為了未來。透過建立一個高品質、可靠的開源資料集,我們希望能夠為繁體中文AI模型的發展做出貢獻,推動台灣乃至全球的健康促進研究。”
該專案的實施將採取階段性進展。首先,團隊將針對全台醫療院所進行廣泛的網路搜尋,以確定有效的網址。隨後,根據網頁結構調整程式碼,自動下載衛教相關的資訊,包括文字、圖片、影片及出處等。這一步驟的完成,將為後續的資料分析和整理打下堅實的基礎。
接下來,利用GPT-4和Gemini的先進API,團隊將對收集到的資料進行深度分析,從中提煉出精華內容並製作出詳細的輔助說明、總結或結論。這一過程不僅能夠提高資料的可用性和價值,更能夠確保最終生成的資料集在質量和可靠性上都達到最高標準。
最終,該項目將生成一個符合開源規範的MiniGPT-4多模態大語言模型所需的多模態資料集,並計劃將其公開分享,供g0v零時小學校以及廣大的研究者和開發者使用。這不僅能夠加速相關領域的研究進展,更將促進健康促進相關應用的創新和發展。
蔡志仁組長強調,這個項目的成功將是台灣AI研究與開發領域的一大里程碑。透過這種開源共享的方式,可以極大地促進資訊的流通和知識的累積,從而推動整個社會的進步。
g0v零時小學校的繁體中文AI開源實踐計畫的負責人也表示,他們對「大量閱讀台灣研究的健康促進小幫手」項目抱有極高的期望,相信其最終成果將對提升公眾健康、推動AI技術的發展以及促進開源文化的擴散產生深遠的影響。
隨著該計畫的進一步實施,我們期待「大量閱讀台灣研究的健康促進小幫手」能夠為台灣乃至全世界的健康促進和AI研究領域帶來更多的創新和突破。
隨著這個項目的進展,公眾將有機會見證AI技術在健康促進領域的巨大潛力和價值。此外,「大量閱讀台灣研究的健康促進小幫手」項目的成功實施也將為其他研究者和開發者提供一個重要的參考模板,展示如何有效地利用開源大語言模型和多模態數據集來解決實際問題,特別是在公共衛生領域。
這一項目不僅僅是技術的展示,更是一次對社會責任的承諾。通過將這些資源開放給公眾,項目組希望能夠激勵更多的人參與到健康促進和AI技術的研究中來,從而共同推動社會的健康和福祉。
值得一提的是,該項目的開源性質將大大降低進入門檻,使得無論是學術界還是業界的研究人員,甚至是對AI和健康促進感興趣的普通公眾,都能夠輕鬆獲取和利用這些資源進行研究和開發。這不僅能夠促進跨領域的交流和合作,更能夠加速創新的步伐,為解決全球健康問題提供新的思路和方案。
隨著項目進展和成果的不斷累積,我們有理由相信,「大量閱讀台灣研究的健康促進小幫手」將成為台灣乃至全球健康促進領域一個重要的里程碑。它不僅將推動健康促進的研究和實踐走向更高的水平,也將為全人類的福祉作出積極貢獻。
我們期待看到這一項目在未來的發展,並相信它將為我們帶來更健康、更美好的明天。
圖1、大量閱讀台灣研究的健康促進小幫手