即時適應式AI: 一教就會的多模態互動系統
技術特色
具有創新 Visual RAG 之多模態系統,只要一張圖的自然語言教學,在地運算,無需上雲。
技術說明
本系統以大語言模型為核心,透過自然語音理解使用者意圖,協調視覺、語音與影像追蹤模型,精準控制PTZ攝影機執行複雜任務,實現自然的人機互動。創新的Visual RAG架構支援即時學習,只要一張圖像的教學,也不需程式開發者介入,現學現賣,翻轉AI學習方式。而所有大型模型皆整合於本地端電腦,無需仰賴雲端,兼具高效運算、快速反應與資料隱私保護,展現AI應用的新典範。
技術聯絡人
姓名:陳鼎升
電話:03-5915499
信箱:justinchen@itri.org.tw