人們從經驗中學習,體驗越豐富,我們能學到的東西就越多。在稱為深度學習的人工智慧 (AI) 學科中,由 AI 硬體和軟體所驅動的機器也是如此。機器可以學習的經驗是由它們所取得的資料所定義,而資料的數量和品質決定了它們可以學習的程度。
深度學習是機器學習的一個分支,與傳統的機器學習演算法不同,無論取得多少資料,許多演算法的學習能力都有其侷限,而深度學習系統可以透過存取更多資料來改善學習效能:擁有更多經驗的機器版本。在機器透過深度學習獲得足夠的經驗之後,它就可以執行特定工作,例如駕駛汽車、偵測農田裡的雜草、偵測疾病、檢查機械以找出故障等。
深度學習網路會從它們所體驗的資料,探索其中錯綜複雜的結構來學習。透過建立具有多個處理層的運算模型,這些網路可以形成多個抽象層來呈現資料。
例如,可以使用大量(如數百萬)影像(例如含有貓的影像)來訓練稱為卷積神經網路 (convolutional neural network) 的深度學習模型,這類神經網路通常是從擷取影像所包含的像素中進行學習,它會將代表貓特徵的像素群組予以分類,當出現爪子、耳朵和眼睛等特徵群組時就表示影像中存在貓。
深度學習與傳統機器學習在根本上並不相同。在這個範例中,領域專家需要花相當多的時間來設計傳統的機器學習系統,以偵測代表貓的特徵。而透過深度學習,只需向系統提供大量的貓影像,系統就可以自主學習代表貓的特徵。
對許多工作而言,例如電腦視覺、語音辨識(也稱為自然語言處理)、機器翻譯和機器人,深度學習系統的表現遠遠超過傳統的機器學習系統。這並不是說相較於傳統的機器學習系統,建置深度學習系統會相對更容易一點。雖然深度學習能夠自主辨識特徵,但仍需要調整數千個超參數(knob),才能讓深度學習模型發揮效用。
我們正處於前所未有的機會時代,深度學習技術可協助我們實現新的突破。深度學習在發現系外行星和新藥物,以及偵測疾病與次原子粒子方面發揮了重要作用。它從根本上增強了我們對生物學的理解,包括基因學、蛋白質體學、代謝學、免疫學等。
我們也生活在一個面臨嚴峻挑戰的時代。氣候變遷威脅著糧食生產,有一天可能會為了爭奪有限資源而引發戰爭。人口不斷增長將加劇環境變化所帶來的挑戰,預計到 2050 年人口將達到 90 億。這些挑戰的範圍和規模,需要我們透過深度學習來實現更高層次的應對智慧。
在大約 5 億 4 千萬年前的寒武紀大爆發期間,視覺成為動物的競爭優勢,很快就成為進化的主要驅動力,加上生物神經網路在處理視覺資訊方面的進化,視覺為動物提供了周圍環境的地圖,並提高他們對外在世界的認知。
如今,作為人造眼睛的攝影機結合了可處理這些眼睛所擷取視覺資訊的神經網路,導致資料導向的 AI 應用程式呈現爆炸性成長。正如視覺在地球生命的進化過程中扮演重要角色一樣,深度學習和神經網路也將增強機器人的能力。它們將越來越瞭解自己的環境、做出自主決策、與人類合作,並增強自己的能力。
機器人
AI 和深度學習的進步帶動了機器人技術的許多最新發展。例如,AI 讓機器人能夠感知環境並做出回應,這種功能擴大了它們可以執行的功能範圍,從在倉儲樓層中導航找路,到分類和處理不均勻、易碎或混雜在一起的物體。像撿起草莓這樣簡單的事情對人類來說是一項簡單的工作,但對機器人來說卻非常困難。隨著 AI 的發展,這項進展將會提升機器人的能力。
AI 的發展意味著我們可以預期未來的機器人會越來越多地被當作人類的助手。機器人不僅像今天使用的那樣用於理解和回答問題。他們還能夠根據語音命令和手勢採取行動,甚至能預測員工的下一步動作。如今,協作機器人已經與人類一起工作,人類和機器人各自執行最適合其優勢的單獨工作。
農業
AI 有潛力徹底革新農業。如今,深度學習可讓農民部署能夠看到並區分農作物和雜草的設備。這種能力使除草機能夠選擇性地只對雜草噴灑除草劑,而不會影響其他植物。使用具有深度學習能力的電腦視覺功能的農業機器時,甚至可以透過選擇性噴灑除草劑、肥料、殺菌劑、殺蟲劑和生物製劑來最佳化田地中的個別植物。除了減少除草劑用量和改善農業產出之外,深度學習還可以進一步擴展到其他農業操作,例如施肥、灌溉和收割。
醫療影像與醫療
深度學習在醫療影像方面的效果特別好,因為有高品質的資料,並且可以使用卷積神經網路對影像進行分類。例如,深度學習在分類皮膚癌方面可能與皮膚科醫生一樣有效,甚至做得更好。有幾家廠商的深度學習演算法已獲得 FDA 核准用於診斷用途,包括用於腫瘤學和視網膜疾病的影像分析。深度學習還能透過電子健康記錄資料來預測醫療事件,在提高醫療品質方面取得了重大進展。
深度學習的未來
目前,已有多種神經網路架構針對特定類型的輸入和工作進行了最佳化。卷積神經網路非常適合將影像分類,另一種形式的深度學習架構則使用循環神經網路來處理順序資料。卷積神經網路模型和循環神經網路模型都執行所謂的監督學習,這表示它們需要龐大資料才能學會。未來,更精密的 AI 類型將採用無監督的學習方式,目前業界正在進行大量研究,以開發無監督和半監督的學習技術。
強化學習是與深度學習有些不同的例子。在模擬環境中,代理程式只能透過獎勵和懲罰來反覆試驗學習,擴大此領域的深度學習被稱為深度強化學習 (DRL),這個領域已經取得了相當大的進展,DRL 程式在古老圍棋遊戲中擊敗人類就證明了這一點。
設計神經網路架構來解決問題是非常困難的事,而且由於需要調整許多超參數和需要最佳化的許多損失函數而變得更加複雜。現在已經有許多研究活動正在鑽研如何讓神經網路架構可以自主學習得更好,這種「學會學習」也稱為元學習 (metalearning) 或自動化機器學習 (AutoML),正在穩步進展中。
目前的人工神經網路是以 1950 年代對人類大腦處理資訊的理解為基礎,從那時起至今,神經科學已取得了長足的進步,因此深度學習架構變得非常精密,以至於它們似乎呈現出諸如網格細胞之類的結構,這些結構存在於生物神經大腦中用於導航。神經科學和深度學習都可以從跨界 (cross-pollination) 理念中相互受惠,而且這些領域很可能會在某個時間點開始融合。
我們不再使用機械式電腦,在某些時候,我們也不會使用數位電腦,我們將改用新一代的量子電腦。近年來量子運算領域取得了多項突破,而量子電腦提供的驚人運算能量肯定有益於學習演算法,您也可以使用學習演算法來瞭解機率量子電腦的輸出。量子機器學習是機器學習中非常活躍的一個分支,首屆量子機器學習國際會議於 2018 年舉行,是一個很好的開端。
移除 AI 基礎架構的障礙,實現更高效的資料收集,並加速 AI 工作負載,讓雲端整合更順暢。