課程說明
課程代碼:23964
講師:元智大學電機工程學系甲組 /黃郁惠 教授
電腦視覺加速晶圓產線驗證,從古樂譜到晶片檢測AI如何看見世界
介紹電腦視覺與深度學習的應用,涵蓋 RGB 映射、像素處理等基礎概念。
主要應用範例
講者討論 Google Lens 在 Google App 中的圖像檢索功能、iPhone 的 Face ID(臉部辨識,用於 Apple Pay)、以及 Google Magic Eraser(圖像修補技術,基於生成模型),並延伸到 Pixel 手機和 Apple Intelligence 的 AI 功能。
技術發展與挑戰
內容提及 2012-2013 年 AlexNet 革命性改變特徵提取與分類,ImageNet 挑戰、GPU(如 Nvidia)在深度學習中的角色,以及語意分割、晶圓骨架辨識(wafer skeleton identification)等產業應用,包括 ASML 設備和晶片封裝挑戰。
先進模型介紹
講者解釋 Segment Anything Model (SAM) 和 Meta 的基礎模型,用於高解析圖像分割,透過提示(prompt,如點擊或邊界框)處理圖案多樣性,並討論 GPU 記憶體限制與 divide-and-conquer 策略。
結語與啟發
影片強調 AI 基礎模型的即時可用性,鼓勵從 Python 開始應用,並總結晶圓識別、圖案多樣性。