摘要
人工智慧(AI)的研究,可說是如何將生物腦部功能模型化(單純化)的研究,由於深度學習的技術發展,使得國際大廠及研究機構投入許多資源至此領域,因此造就深度學習的軟體框架及原始碼的開放,開始讓產業界大量使用深度學習進行預測及判讀。
在生成技術方面,相對於傳統用於分類與辨識的人工智慧,可製作出與照片幾無差異的影像,或是與本人一模一樣聲音的「生成AI」,又被稱為新世代AI。除了可以大量產生辨識用AI用途的訓練資料之外,還可望大幅降低動畫描繪、商業設計、虛擬實境(VR)用影像之製作成本。
生成AI技術,在通訊與廣播領域也有很高的使用價值。因為相較於傳統基於規則的編碼技術與影像缺損的修復,採用深層學習的技術,不僅壓縮率可望大幅提升,且可發揮遠超過傳統的修復能力。然而在此過程中,判斷發送端的資料是否正確傳遞至接收端之指標與基準,也勢必面臨很大的改變。
此外在近年,較傳統深度神經網路(DNN)更接近腦部的「脈衝神經網路(SNN)」,在節能省電的效能方面,開始大幅凌駕DNN。美國Intel、IBM等一線大廠,也紛紛積極投入相關技術的開發。業界預估在不久的將來,SNN將可望取代DNN成為主流技術。
在自然語言處理方面,電腦是否能理解人類語言是人工智慧發展成熟的一項指標。自從大數據發展後,帶來自然語言技術與應用發展,產生Apple Siri、Google翻譯等諸多劃時代人工智慧應用。事實上,自然語言應用已經深入在企業、個人的許多日常應用中。包含:語音助理、社群聆聽、人資管理、疾病預防、授信分析等。
長久以來交談式AI是人機互動介面的發展重點,發展至今已有70多年的歷史。2010年IBM推出的Watson在問答競賽中稱霸,以及同年Apple推出的Siri,不僅證明了自然語言處理技術的成熟,更引領交談式AI走向商業化,近年更是全球大廠爭相投入的重點領域。其中深度學習與知識圖譜在未來的重要性備受專注。
在人工智慧領域迎來第三波熱潮後,知識圖譜是近年深受關注的關鍵技術之一。2012年Google首先推出了知識圖譜搜尋服務,證明知識圖譜在供需媒合的顯著效益,吸引各產業龍頭積極布局研發,並成功實踐了許多應用案例。
本書以人工智慧之技術發展為主題,彙整人工智慧新近的重要技術發展,包括自然語言處理與知識圖譜等相關技術,以及在各產業領域之應用,供產官學研相關人士作為參考。
- 前言 I
目錄 III
圖目錄 IV
表目錄 VIII
第一章 人工智慧產業發展動向 1
一、 AI產業發展現況與創新應用趨勢 1
二、 2020年人工智慧技術及產業趨勢觀測 12
第二章 人工智慧技術發展趨勢分析 19
一、 深度學習發展及運用現況 19
二、 技術再進化—生成AI之技術現況與應用趨勢分析 24
三、 基準面臨變革—生成AI融入資通訊技術之趨勢分析 35
四、 AI技術新突破—神經網路DNN與SNN發展動向剖析 44
第三章 人工智慧自然語言處理與知識圖譜 57
一、 自然語言處理於各應用領域之案例探討 57
二、 交談式AI發展趨勢-從深度學習到知識圖譜 75
三、 深度學習下知識圖譜技術演進與發展趨勢 94
第四章 結論 107
附錄 111
一、 英文名詞縮寫對照表 111
二、 中英文名詞對照表 112
- 圖1 1 萬物聯網時代下人工智慧生態體系 1
圖1 2 人工智慧商業價值金字塔與核心技術 4
圖1 3 全球主動式裝置數量統計(按IoT與非IoT分) 6
圖1 4 全球M2M裝置數量 7
圖1 5 全球人口與IoT數量 8
圖1 6 全球機器人銷售量 9
圖1 7 全球智慧音箱數量與使用者目的 10
圖1 8 全球人工智慧科技支出與累計收入預測 11
圖1 9 全球自動化與人工智慧商業支出 12
圖1 10 人工智慧軟體框架2016-2020上半年更新次數 13
圖1 11 聯盟學習法運作流程 15
圖2 1 DeepFake將原本的女主角換臉 21
圖2 2 Style2paints將原本黑色的漫畫草圖進行上色 21
圖2 3 運用著色後的鏡框來混淆深度學習網路的判讀 23
圖2 4 生成AI為現代的「阿拉丁神燈」 27
圖2 5 一切都是「祕密與機關」 28
圖2 6 2014年兩項生成AI問世 30
圖2 7 研究開發案例近年也直線上升 31
圖2 8 以潛在空間內的特徵向量操作來控制生成資料 32
圖2 9 未來電影將可訂製? 34
圖2 10 已區分不出與照片的差異 35
圖2 11 生成AI應用於新世代資訊通訊技術 36
圖2 12 基於規則的編碼技術在降低位元速率方面已面臨極限 38
圖2 13 刻意讓對於人類無關緊要、不需忠實重現的部份缺損,再於解碼時利用GAN增補修復 40
圖2 14 以「預測」而非增補來修復缺損的部份 41
圖2 15 時間方向連續性的確保,也採用GAN來學習 42
圖2 16 可自由自在進行動態影像的超解析度成像 43
圖2 17 朝向更接近生物的腦神經模型發展 45
圖2 18 神經細胞與突觸的數量與老鼠相當 46
圖2 19 發展性大幅超越DNN 48
圖2 20 積極排除不具有因果性的資料 49
圖2 21 在擅長的領域中,遙遙領先競爭對手 52
圖2 22 以興奮性MC與抑制性GC的組合,將氣味編碼 54
圖2 23 EPL僅需學習一次,便可發揮很高的分類性能 55
圖2 24 Intel的SNN技術社群已有75家企業與組織參與 56
圖3 1 萬事達卡聊天機器人APP 59
圖3 2 Zendesk Answer Bot 知識管理功能 60
圖3 3 DigitalGenius 建議信賴問題回應 61
圖3 4 Woebot 語言對話治療APP 61
圖3 5 Sprout Social社群聆聽軟體 62
圖3 6 Sentifi社群聆聽軟體 63
圖3 7 WonderFlow自然語言生成建議 64
圖3 8 MarketMuse自然語言生成建議 65
圖3 9 Textio APP自然語言工作描述建議 66
圖3 10 Censia人才搜尋過濾 67
圖3 11 Mya人才招募聊天機器人 67
圖3 12 HoneIt人才面試錄音分析 68
圖3 13 Ambit團隊溝通評估 69
圖3 14 Linguamatics醫療NLP平台 70
圖3 15 Winterlight Labs團隊溝通評估 71
圖3 16 ZestFinance信用評等評估方式 72
圖3 17 交談式AI分類 75
圖3 18 與交談式AI ELIZA對談 77
圖3 19 與交談式AI Jabberwacky對談 78
圖3 20 ALICE與ELIZA互相對談 79
圖3 21 IBM Watson參與危機邊緣(Jeopardy!) 80
圖3 22 Amazon Echo智慧音箱與Alexa虛擬助理 81
圖3 23 微軟Cortana與微軟小冰執行示例 82
圖3 24 Google Home系列產品 83
圖3 25 Samsung Bixby 84
圖3 26 交談式AI技術架構 85
圖3 27 結合深度學習與統計方法的序列標註架構 87
圖3 28 知識圖譜技術架構 88
圖3 29 端到端深度學習的知識問答架構 89
圖3 30 包含注意力機制的深度學習對話生成模型 91
圖3 31 考量多輪對話上下文的深度學習生成模型 92
圖3 32 知識圖譜三元架構組成方式範例 95
圖3 33 知識圖譜技術演進歷程 96
圖3 35 以歸類為主的電商知識架構 99
圖3 36 支持複雜知識模型與協作模式的新型態架構 100
圖3 37 圖資料庫與傳統資料庫差異 100
圖3 38 包含圖資料庫與傳統資料庫的融合架構資料庫 101
圖3 39 端到端深度學習架構取代傳統機率統計模式 102
圖3 40 深度學習結合外部知識的聯合學習機制 103
圖3 41 運用開放知識庫的知識融合機制 103
圖3 42 應用深度學習人機協作的知識融合機制 104
圖3 43 運用知識庫擴充傳統搜尋引擎檢索條件 105
圖3 44 融合圖嵌入的協同推薦機制 105
- 表1 1 各國及廠商之人工智慧規範及倫理政策 16
表3 1 自然語言應用趨勢 73
付款方式
匯款
匯款銀行:華南銀行-和平分行 (總行代號:008)
戶名:財團法人資訊工業策進會)
帳號:98365-05099-001-3)
※ 請於匯款時以發票抬頭匯款,並於匯款後將匯款明細如:發票號碼、匯款日期、匯入帳戶等傳真至 (02)2732-8943 ※
信用卡
您可直接線上訂購,或是列印後,傳真到 02-2732-8943。 我們收到訂購單後,將會立即與您聯繫確認。 如有任何問題,歡迎聯絡 MIC會員服務專線:(02)2378-2306,謝謝。