課程說明
課程代碼: 24118
講師:元智大學工業工程與管理學系/孫天龍教授
探討了如何運用大語言模型(LLM)與多模態技術來進行工業安全中的不適當動作偵測。
孫老師指出,相較於傳統需大量手動標註資料的 CNN 影像辨識,現代技術透過 OpenAI 的 CLIP 模型將圖片與文字轉化為對齊的向量(Embedding Vector),實現了無需重新訓練的 Zero-shot 辨識。
這項進步使得使用者只需透過編寫提示詞(Prompt),即便不具備深度學習背景,也能快速開發偵測系統。
然而,實測結果顯示,雖然思考型模型具備極高精準度,卻面臨運算成本過高與推論速度緩慢的挑戰。
最後,孫老師強調未來需透過地端部署與更強大的硬體支援,才能在工廠端實踐更具成本效益且精準的監控應用。