機器學習(ML)的興起:如何在GIS中使用人工智能?
GIS中的機器學習與人工智能?
你可能聽說過 機器學習(ML) . 但是你不確定如何在GIS的環(huán)境中使用它。
簡單地說,機器學習是有意義的,從嘈雜的數(shù)據(jù)發(fā)現(xiàn)模式,你永遠不會認為存在。換句話說,是軟件編寫軟件。
ML沒有應用預先構建的函數(shù),而是通過重復看到的條件來獲得經(jīng)驗,并構建一個模型來應用于新的情況。
例如,谷歌可能使用貝葉斯分類來過濾垃圾郵件。另外,F(xiàn)acebook可能會將其用于面部識別,并自動識別圖像中的面部。我甚至可以在每部電影中呈現(xiàn)尼古拉斯·凱奇。
![](/zb_users/plugin/erx_Weixin/img/zzcm1.jpg)
添加微信好友, 獲取更多信息
復制微信號
但是我們如何在GIS中使用它呢?
機器學習類型(ML)?
機器學習的兩大類是 被監(jiān)督的 和 無監(jiān)督的 . 它們都可以以各種方式應用于GIS應用。首先,兩者有什么區(qū)別?
監(jiān)督學習 只是將數(shù)據(jù)擬合到一個函數(shù)中進行預測。例如,如果在一個圖中繪制數(shù)百萬個采樣點,可以用一條線來近似一個函數(shù)。
無監(jiān)督學習 識別使用未標記數(shù)據(jù)的模式的數(shù)據(jù)。例如,它需要數(shù)以百萬計的圖像,并通過訓練算法運行它們。經(jīng)過數(shù)萬億次的線性代數(shù)運算,它可以拍到一張新的照片,并將其分割成簇。
最重要的是,機器學習是關于優(yōu)化解決問題的。所以它是自動的 自主學習 和 從經(jīng)驗中改進 .
最近,GIS將人工智能應用于分類、預測和分割等領域。
圖像分類(支持向量機)?
當你看衛(wèi)星圖像時,并不總是很容易知道你是在看樹還是草……或者道路還是建筑物。所以想象一下計算機知道這有多困難。
支持向量機(SVM)是一種機器學習技術,它獲取分類數(shù)據(jù)并觀察極值。接下來,它根據(jù)稱為 “超平面” . “超平面”邊緣向上推的數(shù)據(jù)點是 “支持向量” .
“支持向量”之所以重要,是因為它們是最接近對立類的數(shù)據(jù)點。因為這些點是唯一考慮的, 模型中可以忽略所有其他訓練點 . 基本上,您可以向SVM提供樹木和草地的訓練樣本。在此訓練數(shù)據(jù)的基礎上,建立了相應的決策邊界模型。
現(xiàn)在,這個結果 supervised classification 不是很完美,算法還有很多東西要學。我們仍然需要對道路、濕地和建筑物等特征進行研究。隨著算法得到更多的訓練數(shù)據(jù),它最終將改進到任何地方的分類。
經(jīng)驗貝葉斯克里金預測?
你可能知道, kriging interpolation 根據(jù)空間模式預測未知值。它根據(jù)變異函數(shù)估計權重。估計曲面的質量反映在權重的質量上。更具體地說,您需要能夠給出無偏預測和最小方差的權重。
與適合整個數(shù)據(jù)集的一個完整模型的克里金不同,EBK克里金至少模擬了100個 local models by sub-setting the whole data set . 由于該模型可以局部變形以適應每個個體的半變異函數(shù),因此克服了平穩(wěn)性的挑戰(zhàn)。
在 Empirical Bayesian Kriging (EBK) 它使用各種各樣的模擬,反復預測多達100次。每一個半變差函數(shù)彼此都不相同。最后,它將所有半變差圖混合為最終曲面。你不能像傳統(tǒng)的克里格那樣定制。
最后,它輸出它認為是更佳解決方案的內容。就像蒙特卡洛分析一樣,它在后臺為您重復運行它。如果這是一個隨機過程,你會讓這個隨機過程運行上千次。您可以看到結果數(shù)據(jù)中的趨勢,并使用它來證明您的選擇是正確的。這就是為什么 EBK幾乎總是比直接克里金預測得更好。 .
基于k均值的圖像分割與聚類?
K均值算法是目前更流行的數(shù)據(jù)聚類 *** 之一。在k均值分割中,它將未標記的數(shù)據(jù)分組到 組數(shù) 代表 變量K .
這種無監(jiān)督學習 *** 根據(jù)特征的相似性,迭代地將每個數(shù)據(jù)點分配到K組中的一個。例如,相似性可以基于光譜特征和位置。
在一個 unsupervised classification ,k均值算法首先對圖像進行分割,以便進一步分析。接下來,為每個集群分配一個土地覆蓋類。
然而,GIS可以以其他獨特的方式使用集群。例如,數(shù)據(jù)點可能代表犯罪,您可能希望進行群集 熱點和低點 犯罪。或者,您可能希望根據(jù)社會經(jīng)濟、健康或環(huán)境(如污染)特征進行細分。
大數(shù)據(jù)的深度學習與培訓過程?
無論你是在GIS或其他領域,機器學習都是這些天的熱門話題。它是關于提取大數(shù)據(jù)集的。因為如果你能讓電腦檢測到這些功能,它會向你展示你從未注意到的東西。
因為有太多的數(shù)據(jù),您可以從中發(fā)現(xiàn)固有的模式。最終的結果就是一個訓練好的神經(jīng) *** ,它只有一組加權值。
當你訓練大數(shù)據(jù)的時候,這是你需要所有你能得到的火力的時候。但是一旦你訓練了模型,它只是一個文件中有一組權重的模型……這就是為什么機器學習是人工智能的一種形式——因為你可以訓練你的數(shù)據(jù),然后把它應用到全新的東西上,并預測它是什么。
總體而言,GIS使用機器學習進行預測、分類和聚類。AI和ML仍然是一個不斷發(fā)展的領域,每天仍在開發(fā)許多框架。
閱讀更多: Introduction to Machine Learning | Google’s Machine Learning Crash Course
來源:開源地理空間基金會中文分會
來源鏈接:https://www.osgeo.cn/post/1f34b
本站聲明:網(wǎng)站內容來源于 *** ,如有侵權,請聯(lián)系我們,我們將及時處理。