• <ul id="8aeke"><sup id="8aeke"></sup></ul>
    <tfoot id="8aeke"></tfoot>
    <del id="8aeke"></del>
    <abbr id="8aeke"></abbr>
      <strike id="8aeke"><menu id="8aeke"></menu></strike>
    • <tfoot id="8aeke"></tfoot>
    • 知識圖譜在測繪的應用,簡述知識圖譜的應用領域

      2024-05-26 測繪知識 54
      A?AA?

      本篇文章給大家談談知識圖譜在測繪的應用,以及簡述知識圖譜的應用領域對應的知識點,希望對各位有所幫助,不要忘了收藏本站喔。

      目錄一覽:

      知識圖譜在地理信息領域的應用有哪些

      知識圖譜(Knowledge Graph/Vault)又稱為科學知識圖譜,在圖書情報界稱為知識域可視化或知識領域映射地圖,是顯示知識發展進程與結構關系的一系列各種不同的圖形,用可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它們之間的相互聯系。

      主要應用在理論與 *** 與計量學引文分析

      知識圖譜在測繪的應用,簡述知識圖譜的應用領域

      知識圖譜有什么用處?

      知識圖譜 (Knowledge Graph) 是當前的研究熱點。自從2012年Google推出自己之一版知識圖譜以來,它在學術界和工業界掀起了一股熱潮。各大互聯網企業在之后的短短一年內紛紛推出了自己的知識圖譜產品以作為回應。比如在國內,互聯網巨頭百度和搜狗分別推出”知心“和”知立方”來改進其搜索質量。那么與這些傳統的互聯網公司相比,對處于當今風口浪尖上的行業 - 互聯網金融, 知識圖譜可以有哪方面的應用呢?

      目錄

      微信號:MeetyXiao
      添加微信好友, 獲取更多信息
      復制微信號

      1. 什么是知識圖譜?

      2. 知識圖譜的表示

      3. 知識圖譜的存儲

      4. 應用

      5. 挑戰

      6. 結語

      1. 什么是知識圖譜?

      知識圖譜本質上是語義 *** ,是一種基于圖的數據結構,由節點(Point)和邊(Edge)組成。在知識圖譜里,每個節點表示現實世界中存在的“實體”,每條邊為實體與實體之間的“關系”。知識圖譜是關系的最有效的表示方式。通俗地講,知識圖譜就是把所有不同種類的信息(Heterogeneous Information)連接在一起而得到的一個關系 *** 。知識圖譜提供了從“關系”的角度去分析問題的能力。

      知識圖譜這個概念最早由Google提出,主要是用來優化現有的搜索引擎。不同于基于關鍵詞搜索的傳統搜索引擎,知識圖譜可用來更好地查詢復雜的關聯信息,從語義層面理解用戶意圖,改進搜索質量。比如在Google的搜索框里輸入Bill Gates的時候,搜索結果頁面的右側還會出現Bill Gates相關的信息比如出生年月,家庭情況等等。

      另外,對于稍微復雜的搜索語句比如 ”Who is the wife of Bill Gates“,Google能準確返回他的妻子Melinda Gates。這就說明搜索引擎通過知識圖譜真正理解了用戶的意圖。

      上面提到的知識圖譜都是屬于比較寬泛的范疇,在通用領域里解決搜索引擎優化和問答系統(Question-Answering)等方面的問題。接下來我們看一下特定領域里的 (Domain-Specific) 知識圖譜表示方式和應用,這也是工業界比較關心的話題。

      2. 知識圖譜的表示

      假設我們用知識圖譜來描述一個事實(Fact) - “張三是李四的父親”。這里的實體是張三和李四,關系是“父親”(is_father_of)。當然,張三和李四也可能會跟其他人存在著某種類型的關系(暫時不考慮)。當我們把電話號碼也作為節點加入到知識圖譜以后(電話號碼也是實體),人和電話之間也可以定義一種關系叫 has_phone,就是說某個電話號碼是屬于某個人。下面的圖就展示了這兩種不同的關系。

      另外,我們可以把時間作為屬性(Property)添加到 has_phone 關系里來表示開通電話號碼的時間。這種屬性不僅可以加到關系里,還可以加到實體當中,當我們把所有這些信息作為關系或者實體的屬性添加后,所得到的圖譜稱之為屬性圖 (Property Graph)。屬性圖和傳統的RDF格式都可以作為知識圖譜的表示和存儲方式,但二者還是有區別的,這將在后面章節做簡單說明。

      3. 知識圖譜的存儲

      知識圖譜是基于圖的數據結構,它的存儲方式主要有兩種形式:RDF存儲格式和圖數據庫(Graph Database)。至于它們有哪些區別,請參考【1】。下面的曲線表示各種數據存儲類型在最近幾年的發展情況。從這里我們可以明顯地看到基于圖的存儲方式在整個數據庫存儲領域的飛速發展。這幅曲線圖來源于 Graph DBMS increased their popularity by 500% within the last 2 years

      下面的列表表示的是目前比較流行的基于圖存儲的數據庫排名。從這個排名中可以看出neo4j在整個圖存儲領域里占據著NO.1的地位,而且在RDF領域里Jena還是目前為止最為流行的存儲框架。這部分數據來源于 DB-Engines Ranking

      當然,如果需要設計的知識圖譜非常簡單,而且查詢也不會涉及到1度以上的關聯查詢,我們也可以選擇用關系型數據存儲格式來保存知識圖譜。但對那些稍微復雜的關系 *** (現實生活中的實體和關系普遍都比較復雜),知識圖譜的優點還是非常明顯的。首先,在關聯查詢的效率上會比傳統的存儲方式有顯著的提高。當我們涉及到2,3度的關聯查詢,基于知識圖譜的查詢效率會高出幾千倍甚至幾百萬倍。其次,基于圖的存儲在設計上會非常靈活,一般只需要局部的改動即可。比如我們有一個新的數據源,我們只需要在已有的圖譜上插入就可以。于此相反,關系型存儲方式靈活性方面比較差,它所有的Schema都是提前定義好的,如果后續要改變,它的代價是非常高的。最后,把實體和關系存儲在圖數據結構是一種符合整個故事邏輯的更好的方式。

      4. 應用

      在本文中,我們主要討論知識圖譜在互聯網金融行業中的應用。當然,很多應用場景和想法都可以延伸到其他的各行各業。這里提到的應用場景只是冰山一角, 在很多其他的應用上,知識圖譜仍然可以發揮它潛在的價值, 我們在后續的文章中會繼續討論。

      反欺詐

      反欺詐是風控中非常重要的一道環節。基于大數據的反欺詐的難點在于如何把不同來源的數據(結構化,非結構)整合在一起,并構建反欺詐引擎,從而有效地識別出欺詐案件(比如身份造假,團體欺詐,代辦包裝等)。而且不少欺詐案件會涉及到復雜的關系 *** ,這也給欺詐審核帶來了新的挑戰。 知識圖譜,作為關系的直接表示方式,可以很好地解決這兩個問題。 首先,知識圖譜提供非常便捷的方式來添加新的數據源,這一點在前面提到過。其次,知識圖譜本身就是用來表示關系的,這種直觀的表示 *** 可以幫助我們更有效地分析復雜關系中存在的特定的潛在風險。

      反欺詐的核心是人,首先需要把與借款人相關的所有的數據源打通,并構建包含多數據源的知識圖譜,從而整合成為一臺機器可以理解的結構化的知識。在這里,我們不僅可以整合借款人的基本信息(比如申請時填寫的信息),還可以把借款人的消費記錄、行為記錄、網上的瀏覽記錄等整合到整個知識圖譜里,從而進行分析和預測。這里的一個難點是很多的數據都是從 *** 上獲取的非結構化數據,需要利用機器學習、自然語言處理技術把這些數據變成結構化的數據。

      不一致性驗證

      不一致性驗證可以用來判斷一個借款人的欺詐風險,這個跟交叉驗證類似。比如借款人張三和借款人李四填寫的是同一個公司電話,但張三填寫的公司和李四填寫的公司完全不一樣,這就成了一個風險點,需要審核人員格外的注意。

      再比如,借款人說跟張三是朋友關系,跟李四是父子關系。當我們試圖把借款人的信息添加到知識圖譜里的時候,“一致性驗證”引擎會觸發。引擎首先會去讀取張三和李四的關系,從而去驗證這個“三角關系”是否正確。很顯然,朋友的朋友不是父子關系,所以存在著明顯的不一致性。

      不一致性驗證涉及到知識的推理。通俗地講,知識的推理可以理解成“鏈接預測”,也就是從已有的關系圖譜里推導出新的關系或鏈接。 比如在上面的例子,假設張三和李四是朋友關系,而且張三和借款人也是朋友關系,那我們可以推理出借款人和李四也是朋友關系。

      組團欺詐

      相比虛假身份的識別,組團欺詐的挖掘難度更大。這種組織在非常復雜的關系 *** 里隱藏著,不容易被發現。當我們只有把其中隱含的關系 *** 梳理清楚,才有可能去分析并發現其中潛在的風險。知識圖譜,作為天然的關系 *** 的分析工具,可以幫助我們更容易地去識別這種潛在的風險。舉一個簡單的例子,有些組團欺詐的成員會用虛假的身份去申請貸款,但部分信息是共享的。下面的圖大概說明了這種情形。從圖中可以看出張三、李四和王五之間沒有直接的關系,但通過關系 *** 我們很容易看出這三者之間都共享著某一部分信息,這就讓我們馬上聯想到欺詐風險。雖然組團欺詐的形式眾多,但有一點值得肯定的是知識圖譜一定會比其他任何的工具提供更佳便捷的分析手段。

      異常分析(Anomaly Detection)

      異常分析是數據挖掘研究領域里比較重要的課題。我們可以把它簡單理解成從給定的數據中找出“異常”點。在我們的應用中,這些”異常“點可能會關聯到欺詐。既然知識圖譜可以看做是一個圖 (Graph),知識圖譜的異常分析也大都是基于圖的結構。由于知識圖譜里的實體類型、關系類型不同,異常分析也需要把這些額外的信息考慮進去。大多數基于圖的異常分析的計算量比較大,可以選擇做離線計算。在我們的應用框架中,可以把異常分析分為兩大類: 靜態分析和動態分析,后面會逐一講到。

      - 靜態分析

      所謂的靜態分析指的是,給定一個圖形結構和某個時間點,從中去發現一些異常點(比如有異常的子圖)。下圖中我們可以很清楚地看到其中五個點的相互緊密度非常強,可能是一個欺詐組織。所以針對這些異常的結構,我們可以做出進一步的分析。

      - 動態分析

      所謂的動態分析指的是分析其結構隨時間變化的趨勢。我們的假設是,在短時間內知識圖譜結構的變化不會太大,如果它的變化很大,就說明可能存在異常,需要進一步的關注。分析結構隨時間的變化會涉及到時序分析技術和圖相似性計算技術。有興趣的讀者可以去參考這方面的資料【2】。

      失聯客戶管理

      除了貸前的風險控制,知識圖譜也可以在貸后發揮其強大的作用。比如在貸后失聯客戶管理的問題上,知識圖譜可以幫助我們挖掘出更多潛在的新的聯系人,從而提高催收的成功率。

      現實中,不少借款人在借款成功后出現不還款現象,而且玩“捉迷藏”,聯系不上本人。即便試圖去聯系借款人曾經提供過的其他聯系人,但還是沒有辦法聯系到本人。這就進入了所謂的“失聯”狀態,使得催收人員也無從下手。那接下來的問題是,在失聯的情況下,我們有沒有辦法去挖掘跟借款人有關系的新的聯系人? 而且這部分人群并沒有以關聯聯系人的身份出現在我們的知識圖譜里。如果我們能夠挖掘出更多潛在的新的聯系人,就會大大地提高催收成功率。舉個例子,在下面的關系圖中,借款人跟李四有直接的關系,但我們卻聯系不上李四。那有沒有可能通過2度關系的分析,預測并判斷哪些李四的聯系人可能會認識借款人。這就涉及到圖譜結構的分析。

      智能搜索及可視化展示

      基于知識圖譜,我們也可以提供智能搜索和數據可視化的服務。智能搜索的功能類似于知識圖譜在Google, Baidu上的應用。也就是說,對于每一個搜索的關鍵詞,我們可以通過知識圖譜來返回更豐富,更全面的信息。比如搜索一個人的身份證號,我們的智能搜索引擎可以返回與這個人相關的所有歷史借款記錄、聯系人信息、行為特征和每一個實體的標簽(比如黑名單,同業等)。另外,可視化的好處不言而喻,通過可視化把復雜的信息以非常直觀的方式呈現出來, 使得我們對隱藏信息的來龍去脈一目了然。

      精準營銷

      “A knowledge graph allows you to take core information about your customer—their name, where they reside, how to contact them—and relate it to who else they know, how they interact on the web, and more”-- Michele Goetz, a Principal Analyst at Forrester Research

      一個聰明的企業可以比它的競爭對手以更為有效的方式去挖掘其潛在的客戶。在互聯網時代,營銷手段多種多樣,但不管有多少種方式,都離不開一個核心 - 分析用戶和理解用戶。知識圖譜可以結合多種數據源去分析實體之間的關系,從而對用戶的行為有更好的理解。比如一個公司的市場經理用知識圖譜來分析用戶之間的關系,去發現一個組織的共同喜好,從而可以有針對性的對某一類人群制定營銷策略。只有我們能更好的、更深入的(Deep understanding)理解用戶的需求,我們才能更好地去做營銷。

      5. 挑戰

      知識圖譜在工業界還沒有形成大規模的應用。即便有部分企業試圖往這個方向發展,但很多仍處于調研階段。主要的原因是很多企業對知識圖譜并不了解,或者理解不深。但有一點可以肯定的是,知識圖譜在未來幾年內必將成為工業界的熱門工具,這也是從目前的趨勢中很容易預測到的。當然,知識圖譜畢竟是一個比較新的工具,所以在實際應用中一定會涉及到或多或少的挑戰。

      數據的噪聲

      首先,數據中存在著很多的噪聲。即便是已經存在庫里的數據,我們也不能保證它有100%的準確性。在這里主要從兩個方面說起。之一,目前積累的數據本身有錯誤,所以這部分錯誤數據需要糾正。 最簡單的糾正辦法就是做離線的不一致性驗證,這點在前面提過。第二, 數據的冗余。比如借款人張三填寫公司名字為”普惠“,借款人李四填寫的名字為”普惠金融“,借款人王五則填寫成”普惠金融信息服務有限公司“。雖然這三個人都隸屬于一家公司,但由于他們填寫的名字不同,計算機則會認為他們三個是來自不同的公司。那接下來的問題是,怎么從海量的數據中找出這些存在歧義的名字并將它們合并成一個名字? 這就涉及到自然語言處理中的”消歧分析”技術。

      非結構化數據處理能力

      在大數據時代,很多數據都是未經處理過的非結構化數據,比如文本、圖片、音頻、視頻等。特別在互聯網金融行業里,我們往往會面對大量的文本數據。怎么從這些非結構化數據里提取出有價值的信息是一件非常有挑戰性的任務,這對掌握的機器學習,數據挖掘,自然語言處理能力提出了更高的門檻。

      知識推理

      推理能力是人類智能的重要特征,使得我們可以從已有的知識中發現隱含的知識, 一般的推理往往需要一些規則的支持【3】。例如“朋友”的“朋友”,可以推理出“朋友”關系,“父親”的“父親”可以推理出“祖父”的關系。再比如張三的朋友很多也是李四的朋友,那我們可以推測張三和李四也很有可能是朋友關系。當然,這里會涉及到概率的問題。當信息量特別多的時候,怎么把這些信息(side information)有效地與推理算法結合在一起才是最關鍵的。常用的推理算法包括基于邏輯(Logic) 的推理和基于分布式表示 *** (Distributed Representation)的推理。隨著深度學習在人工智能領域的地位變得越來越重要,基于分布式表示 *** 的推理也成為目前研究的熱點。如果有興趣可以參考一下這方面目前的工作進展【4,5,6,7】。

      大數據、小樣本、構建有效的生態閉環是關鍵

      雖然現在能獲取的數據量非常龐大,我們仍然面臨著小樣本問題,也就是樣本數量少。假設我們需要搭建一個基于機器學習的反欺詐評分系統,我們首先需要一些欺詐樣本。但實際上,我們能拿到的欺詐樣本數量不多,即便有幾百萬個貸款申請,最后被我們標記為欺詐的樣本很可能也就幾萬個而已。這對機器學習的建模提出了更高的挑戰。每一個欺詐樣本我們都是以很高昂的“代價”得到的。隨著時間的推移,我們必然會收集到更多的樣本,但樣本的增長空間還是有局限的。這有區別于傳統的機器學習系統,比如圖像識別,不難拿到好幾十萬甚至幾百萬的樣本。

      在這種小樣本條件下,構建有效的生態閉環尤其的重要。所謂的生態閉環,指的是構建有效的自反饋系統使其能夠實時地反饋給我們的模型,并使得模型不斷地自優化從而提升準確率。為了搭建這種自學習系統,我們不僅要完善已有的數據流系統,而且要深入到各個業務線,并對相應的流程進行優化。這也是整個反欺詐環節必要的過程,我們要知道整個過程都充滿著博弈。所以我們需要不斷地通過反饋信號來調整我們的策略。

      6. 結語

      知識圖譜在學術界和工業界受到越來越多的關注。除了本文中所提到的應用,知識圖譜還可以應用在權限管理,人力資源管理等不同的領域。在后續的文章中會詳細地講到這方面的應用。

      參考文獻

      【1】De Abreu, D., Flores, A., Palma, G., Pestana, V., Pinero, J., Queipo, J., ... Vidal, M. E. (2013). Choosing Between Graph Databases and RDF Engines for Consuming and Mining Linked Data. In COLD.

      【2】User Behavior Tutorial

      【3】劉知遠 知識圖譜——機器大腦中的知識庫 第二章 知識圖譜——機器大腦中的知識庫

      【4】Nickel, M., Murphy, K., Tresp, V., Gabrilovich, E. A Review of Relational Machine Learning for Knowledge Graphs.

      【5】Socher, R., Chen, D., Manning, C. D., Ng, A. (2013). Reasoning with neural tensor networks for knowledge base completion. In Advances in Neural Information Processing Systems (pp. 926-934).

      【6】Bordes, A., Usunier, N., Garcia-Duran, A., Weston, J., Yakhnenko, O. (2013). Translating embeddings for modeling multi-relational data. In Advances in Neural Information Processing Systems (pp. 2787-2795).

      【7】Jenatton, R., Roux, N. L., Bordes, A., Obozinski, G. R. (2012). A latent factor model for highly multi-relational data. In Advances in Neural Information Processing Systems(pp. 3167-3175).

      北大鄒磊:知識圖譜原理與應用概述(之一講)

      這篇筆記來自于北大鄒磊教授的知識圖譜講座

      主要內容:

      2012年5月16日,Google發布了“知識圖譜”的新一代“智能”搜索功能,之一次提出了“知識圖譜”的概念。

      知識圖譜(Knowledge Graph):本質上是基于圖的語義 *** ,表示實體和實體之間的關系!構建知識圖譜的目的,就是讓機器具備認知能力,理解這個世界。

      知識圖譜是Web和大數據時代的知識工程新的發展形態。

      知識工程的核心: 知識庫 和 推理引擎

      RDF(Resource Description Framework),目前是描述本體的事實標準

      RDF定義了一個簡單的模型,用于描述資源,屬性和值之間的關系。資源是可以用URI標識的所有事物,屬性是資源的一個特定的方面或特征,值可以是另外一個資源,也可以是字符串。總的來說,一個RDF描述就是一個三元組:主語、謂詞、賓語

      進一步擴展RDFs的詞匯,可聲明 類間互斥關系、屬性的傳遞性等復雜語義 ,支持基于本體的自動推理,提供了一組合適web傳播的描述邏輯的語法,對機器友好,但認知復雜性限制了工程應用。

      實體對齊必然涉及到 實體相似度的計算 ,假設兩個實體的記錄x和y,x和y在第i個屬性上的值是xi,yi,那么需要通過兩步計算:

      自然語言處理和知識圖譜研究是雙向互動的關系。

      RDF概念很早提出了,但是發展比較緩慢,是因為自然語言處理技術發展較慢,手工建立的數據集比較少,從而影響力較少。隨著機器學習等自然語言處理技術的快速發展提高了信息抽取的效率和準確度,通過技術可以快速建立大規模知識圖譜。

      智能問答的 *** :

      知識圖譜本質上是多關系圖,通常用“ 實體 ”來表達圖里的結點、用“ 關系 ”來表達圖里的邊。

      基于關系的知識圖譜存儲管理

      原生知識圖譜存儲管理--RDF

      回答RDF數據上SPARQL查詢==子圖查詢匹配

      原生知識圖譜存儲管理--屬性圖

      分布式知識圖譜存儲管理:

      圖表示學習用于“自然語言問答”:

      1956年達特茅斯會議,提出“人工智能(Artificial Intelligence, AI)”概念。

      “用機器來模仿人類學習以及其他方面的智能”

      “上古”流派:符號主義(Symboli *** )和連接主義(Connectioni *** )

      符號主義發展歷史:

      語義 *** (Semantic Network):1970年,Herbert A.Simon正式提出,通過有向圖來表示知識,作為知識表示的一種通用手段。

      知識工程(Knowledge Engineering):1977年美國斯坦福大學計算機科學家Edward Albert Feigenbaum教授在第五屆國際人工智能會議上提出,確立了知識工程在人工智能中的核心地位。

      人工智能需要機器智能,特別是認知智能,認知智能依賴知識圖譜

      知識圖譜脫胎于符號主義;但是和連接主義的結合是目前的重要研究方向(例如知識圖譜的表示學習等)

      大數據的特點:多樣化(variety)、規模大(volume)和速度化(velocity)

      “世界是普遍聯系的整體,任何事物之間都是相互聯系的” ---- 馬克思《辯證唯物主義》

      “知識圖譜”是面向關聯分析的大數據模型

      知識圖譜在測繪的應用的介紹就聊到這里吧,感謝你花時間閱讀本站內容,更多關于簡述知識圖譜的應用領域、知識圖譜在測繪的應用的信息別忘了在本站進行查找喔。

      客服微信號碼

      客服微信號碼

      客服微信號碼

      客服微信號碼

      留言咨詢
      提交留言

      您將免費獲得

      • 全面診斷

        您將獲得專家對您公司申請資質所需條件的全面診斷服務,我們不同于傳統代辦公司,僅是提供一些通用的,淺顯的建議

      • 找出疏忽點

        我們在了解您公司的基本情況之后,將挖掘出您公司目前不利于資質申請的疏忽點,還將詳細說明您在申請資質時應當改善的確切的事項。

      • 分析需求

        我們通過豐富的從業經驗,結合目前的實際情況,確認好符合您實際經營情況的資質需求。

      • 定制方案與報價

        對您的需求深入了解后,將結合您公司目前的情況,我們將為您量身定制一份資質代辦方案及報價單。

      獲取方案

      ×
      請設置您的cookie偏好
      歡迎來到資質參謀
      我們希望在本網站上使用cookie,以便保障本網站的安全、高效運轉及服務優化,有關我們使用cookie的更多信息,請點擊查看了解更多。
      接收Cookies
      決絕Cookies
      亚洲三级在线免费观看| 亚洲av永久无码精品三区在线4 | 在线亚洲精品视频| 亚洲娇小性色xxxx| 亚洲熟妇无码久久精品| 久久久久久亚洲AV无码专区| 亚洲av无码不卡| 亚洲AV电影院在线观看| 久久久无码精品亚洲日韩蜜桃| 亚洲精品狼友在线播放| 亚洲妇熟XXXX妇色黄| 亚洲AV综合色一区二区三区| 亚洲第一AV网站| 亚洲五月六月丁香激情| 亚洲精品视频久久| 91亚洲一区二区在线观看不卡| 97se亚洲综合在线| 亚洲日本国产精华液| 亚洲国产成人九九综合| 亚洲成年人电影网站| 亚洲中文无码a∨在线观看| 亚洲AV色吊丝无码| 亚洲精品中文字幕无乱码麻豆| 亚洲精品人成网在线播放影院| 亚洲日韩国产精品乱-久| 亚洲色无码专区一区| 亚洲AV无码一区二区一二区| 国产成人高清亚洲一区久久| 亚洲高清视频一视频二视频三| 色九月亚洲综合网| 亚洲毛片不卡av在线播放一区| 中文字幕亚洲综合久久男男| 亚洲人成网7777777国产| 日韩亚洲人成在线综合日本| 亚洲色四在线视频观看| 亚洲国产精品一区二区久| 国产亚洲国产bv网站在线| 亚洲欧美日韩中文高清www777| 国产成人不卡亚洲精品91| 亚洲精品国产综合久久一线| 亚洲精品无码久久久影院相关影片 |