㈠ 在caffe上怎麼做到各個卷積層權值參數共享
通過設置param {name : xxx}參數,如果名字相同就共享,不相同就不共享
㈡ 文稿匹配是什麼意思
文本匹配:
1. 概述
文本匹配,旨在研究兩段文本之間的關系。常用於文本語義相似度(Semantic Textual Similarity & Paraphrase Identification)、問答匹配、自然語言推理(Natural Language Inference/ Recognizing Textual Entailment)、信息檢索(Information Retrieval)等領域。
常見的文本匹配策略分為兩種:表示式(Representation-Based)和互動式(Interaction-Based)。
表示式策略基於孿生神經網路(Siamese Network)架構,兩個主幹網路共享權重,在起始階段,即對兩段文本進行獨立處理。首先,在統一的語義空間中,基於神經網路對兩段文本各自計算其表徵(語義向量);而後,基於得到的文本表徵,來計算兩段文本的相似度。
這樣得到的單句文本表徵,不會隨著句子對(sentence pair)的變陪散化而變化,因此只需一次計算,即可離線判棗存儲文本的表徵。兩個極蘆沖氏具代表性的工作為DSSM、Sentence-BERT。
㈢ 數字孿生系統中的關鍵技術有哪些
(1)三維孿生模型:數字空間要根據實體設備建立對應功能的三維孿生模型
㈣ 兩個男的是孿生兄弟共同跟一個女的在一起的小說
《二與一為三》
講的是兩個孿生兄喚伏兄弟都愛上了女主角,結局是女主角生下了男主角的孩羨攜子,然後又相遇了。
《天下兄弟》
講的是孿生兄弟同時愛上一個女人,殊途同歸的命運故事。。。。
《折翼天使》
講的是有關青春迷惘的小說。。。。。。。。
不知道有沒你鏈叢要的,滿意請採納!!!!!!!!!!!!!!!!!!
㈤ 我們可以把自己虛擬化了!數字孿生如何改變城市與個人
文 |陳龍
本文授權轉載自:集智俱樂部
導語
資深智慧城市研究者、華為公司智慧城市高級顧問王鵬,受邀在騰訊研究院×集智俱樂部 AI&Society沙龍上發表以「從城市數據到智慧城市」為題的演講。筆者回顧了王鵬對城市數據及其應用的,並結合清華大學龍瀛團隊在人類數字化上的最新研究,提出對城市和個體虛擬化的探討。講座視頻實錄請見文末小程序與網頁鏈接。
源於工業4.0的數字孿生
數字孿生(Digital Twin)這一概念最早可以追溯到Michael Grieves教授2002年在密歇根大學PLM(產品生命周期管理)中心對產業界做的一次演講(雖然沒有書面證據,但這仍被廣泛認為是數字孿生最早來源)。
2014年,Michael Grieves在其撰寫的「Digital Twin: Manufacturing Excellence through Virtual Factory Replication」白皮書中進行了詳細的闡述。他認為通過物理設備的數據,可以在虛擬(信息)空間構建一個可以表徵該物理設備的虛擬實體和子系統,並且這種聯系不是單向和靜態的,而是在整個產品的生命周期中都聯系在一起。
在此之後,數字孿生的概念逐步擴展到了模擬模擬、虛擬裝配和巧扮襲3D列印等領域。隨著物聯網技術、人工智慧和虛擬現實技術的不斷發展,更多的工業產品、工業設備具備了智能的特徵,而數字孿生也逐步擴展到了包括製造和服務在內的完整的產品周期階段,並不斷缺穗豐富著數字孿生的形態和概念。
企業界走在數字孿生的前列。工業4.0下的數字孿生被各大軟體廠商賦予了各自的理解,並將其與自身業務融合,致力於打造出現實世界與虛擬世界融合的解決方案。
美國通用電器公司(GE)與ANSYS公司藉助數字孿生這一概念,提出物理機械和分析技術融合的實現途徑,讓每個引擎,每個渦輪,每台核磁共振都擁有一個數字化的「雙胞胎」,並通過數字化模型在虛擬環境下實現機器人調試、試驗、優化運行狀態等模擬,以便將最優方案應用在物理世界的機器上,從而節省大量維修、調試成本。
西門子引用數字孿生的概念,來形容貫穿於產品生命周期各環節間的數據模型。通俗地說,數字孿生就是模擬模擬一些工廠的實際操作空間,從產品設計到產線設計,到設備製造方的機械設計和工廠的規劃排產,到最後製造執行和產品大數據。
法國軟體公司達索系統在數字孿生創新協作和驗證中,不僅重視產品的數字化表現,更試圖通過三維體驗平台實現設計師和客戶之間的互動。
德國軟體公司SAP基於Leonardo平台在數字世界打造了一個完整的數字化雙胞胎,在產品試驗階段採集設備的運行狀況,進行分析,得出產品的實際性能,再與需求設計的目標比較,形成產品研發的閉環體系。
簡而言之,工業4.0下的數字孿生,更多是為製造業提供了產品在物理空間和虛擬空間之間的映射關系,以及在實體世界以及數字虛擬空間中記錄、模擬、預測對象全生命周期的運行軌跡的過程。
物理世界和數字副本
數字孿生:催生智慧城市2.0
值得注意的是,數字孿生的概念不僅活躍在工業4.0的製造業,也越來越頻繁地出現在智慧城市領域。隨著ICT(信息、通信、技術)成為智慧城市發展的主要動能,移動通信、互聯網、雲計算、感測器、人工智慧、量子通信在智慧城市都得到了廣泛應用。全域感知、數字模擬、深度學習等各領域的技術發展也即將迎來拐點,這使得城市的數字孿生應運而生。
中國智慧城市數字孿生的發展還有很長一段路要走。數字孿生高度依賴感測器所採集的數據和信息,而就目前的技術水平來看,精細化尺度下城市數據的全域感知和 歷史 多維數據的獲取,依舊有難度。物理實體空間的數據不夠詳盡,將直接導致其數字副本的缺失。現階段的數字孿生距離想像中孝兄的沙盒系統模擬推演、人工智慧決策等功能仍有很大差距。
數字孿生在智慧城市發展與建設中的核心價值在於,它能夠在物理世界和數字世界之間全面建立實時聯系,進而對操作對象全生命周期的變化進行記錄、分析和預測。智慧城市中的數字孿生可以分為四個階段,分別是
對城市現狀進行精準、全面、動態映射的現狀孿生;
從 歷史 數據中學習、分析、識別、總結並發現城市運行規律的學習孿生;
人工監督下模擬不同環境背景下的發展情景的模擬孿生;
最終通過實時數據接入與人工智慧自動決策的自主孿生。
同時,我們也應看到數字孿生在感測器、5g和邊緣計算技術不斷發展中所具備的巨大潛力。感測器的高密度部署與高精度感知,結合5g和邊緣計算的實時結構化計算回傳,對城市物理空間的全域感知和實時更新,將是5g時代的常態。一磚一瓦、一草一木、一桌一椅、一人一車,都會以不同的頻率更新位置和狀態信息,從而實現真正的「全息」虛擬城市。
城市數據:數字孿生的DNA
在智慧城市的建設中,數字孿生的核心在於構建與城市物理空間全面映射的虛擬(信息)空間。不同於製造業產品周期管理中被製造商全面掌握的產品信息化數據,城市作為一個龐大的復雜系統,其包含的物理空間及過程,無時無刻不在產生著多維的海量大數據,這無疑在數據收集、處理、運算、儲存和管理上向城市數字孿生提出了挑戰。
近年來,以數據為核心的城市生態鏈構架了智慧城市的頂層設計,形成以共享信息為中心、各行業協同實現的「感知-應用-共享信息」的智慧城市模式。與此同時,在大數據、人工智慧、雲計算、物聯網等新興ICT技術的推動下,多維的海量城市數據也逐步以不同方式被挖掘並應用在智慧城市的研究和實踐中。
傳統城市統計數據的電子化與空間可視化是城市大數據發展邁出的第一步。基於GIS平台上對行政邊界的勾繪,並將其與傳統的年鑒統計數據相匹配,就能實現傳統數據的電子化與可視化,並依託GIS空間分析功能實現空間可視化與分析。
Cityeye上對傳統統計數據的電子化與空間可視化
互聯網大數據的應用標志著城市真正邁入了大數據時代,而互聯網大數據也儼然成為近年來城市研究的「寵兒」,無論是學界還是業界都在積極 探索 互聯網大數據為城市研究和發展帶來的諸多可能。
互聯網大數據最大的優勢在於其打破了傳統數據自上而下的數據採集壁壘,而是以自下而上的方式提供著精細尺度下的多維數據,如記錄城市內所有地理實體空間位置與屬性的興趣點(POI)數據;反映話題熱度與用戶畫像的社交媒體大數據;實時展示人口空間分布的熱力圖等。
而隨著智慧城市的到來,感測器技術的進步與成熟為城市研究提供了另一條數據獲取之路。
通過多模塊集成感測器在城市內部的架設,可以實現精細尺度下城市環境、人車行為等數據的實時感知與收集。如由City Grid城市網格數據監測站,可利用多模塊感測器網路監測人車流量及環境質量,如風速、風向、光照、溫濕度和pm2.5等。City Grid是一款針對城市空間精細化感知的物聯網產品,也是感測器技術應用在城市全域感知、數據採集,乃至實現城市未來微觀環境與人車行為預測的經典案例。王鵬團隊也曾多次利用City Grid多次在清華大學校園和白塔寺社區內進行監測布點、數據採集,並針對城市環境和人群行為開展深入分析。
City Grid城市網格數據監測站
LBS數據(基於位置服務的數據),通過運營商採集用戶與基站間不間斷的信令數據,來獲取移動服務用戶相對精確的實時空間位置。因其具備用戶量大,覆蓋范圍廣等特徵,是描述城市人口數量和空間分布的「終極」數據。
我們把自己數字化了!
Digital Self 數字自我
在感嘆數字孿生如何顛覆性地改變製造業和城市管理與運營的同時,有學者已經開始 探索 如何打造人類個體的數字雙胞胎。
清華大學龍瀛團隊的研究助理張昭希近期發表了一篇題為「Application of wearable cameras in studying inpial behaviors in built environment」的期刊論文,提出創新性地使用可穿戴式相機對個體行為和城市空間感知進行數據收集、分析與模擬。
研究團隊利用攜帶型相機,記錄佩戴者正前方每5分鍾一張的圖片數據,並通過人工識別、計算機視覺分析和色彩識別分析等手段,對佩戴者個體行為特徵、時間分配、路徑轉移、場所事件等要素進行了分析研究。研究結果表明,可穿戴式相機採集到的圖片數據具有豐富的個體行為與時空信息,可以有效描述個體在空間中的行為特徵。
數字化的「生命日誌」
隨著大數據在城市研究中的廣泛應用和快速發展,基於建成環境層面的形態要素數據(如遙感、街景和POI數據)和多種互聯網數據(如微博、點評和手機信令數據)開展的針對大規模群體的研究,為利用大數據解釋城市問題提供了大量案例參考,並逐步建立了理論基礎。然而,這些基於較粗尺度城市物理空間,抑或是大規模群體的大數據,仍較難被應用於個體的深層剖析和研究解讀。
而可穿戴式相機為大規模採集個體數據提供了新的契機,通過記錄的圖片數據將個人活動信息數字化,形成「數字自我」的 電子檔案,彌補了現有研究中對個體行為數據採集不夠連續、維度不夠豐富的問題,這也是從城市環境數據化向個體行為信息化的轉變之一。同時,個體行為信息化也將推動研究方法的革新和新技術的介入,從主觀的「個體感知」轉向客觀的「量化研究」。
從數字孿生的角度來看,基於可穿戴式相機記錄下的圖片數據,通過整理和分析可以剝離出個體在物理空間中的行為特徵要素,進一步將這些個體行為特徵要素在時空上數字化,從而構建了其在虛擬(信息)空間內的數字雙胞胎。同時,圖片數據中包含的大量物理空間建成環境要素同樣可以被數字化並記錄在虛擬空間內,從而反映物理空間和虛擬空間內個體和環境之間的交互。
科技 的日新月異不僅使人們的生活方式發生了巨大改變,同時也影響著城市運行的方方面面。不可置否的是,新技術的高速發展給城市研究與實踐帶來了新的機遇,推動著城市規劃技術和工具的突破與創新。如龍瀛提出的數據增強設計,允許規劃師們藉助多維城市大數據對城市做出更全面、精準的分析與規劃設計響應。
同時,在信息通訊技術革新的助力下,數據儲存、挖掘、雲計算和可視化等技術的完善也為研究城市提供了新視角。人們的思維方式從傳統的機械思維向大數據思維轉變,認知方式也逐漸向虛實結合的體驗過度。城市數字孿生、數字自我的概念也將在第四次工業革命的技術革新下擁有更豐富的內涵。
參考資料
[1] 王鵬:展望未來城市,萬物皆可運營 | 智慧城市長文綜述
[2] 王鵬:城市數據到智慧城市
[3] Long, Y. (2019). (New) Urban Science: Studying New Cities with New Data, Methods and Technologies. Landscape Architecture Frontiers, 7(2), 8-21.
[4] Zhang, Z. X., & Long, Y. (2019). Application of Wearable Cameras in Studying Inpial Behaviors in Built Environments. Landscape Architecture Frontiers, 7(2), 22-37.
㈥ 數字孿生為數據中心插上「可持續」的翅膀
為了能以更加可持續的方式運營企業,企業對數字基礎設施的要求也越來越高,不止是出於成本和效率的考量,從環境的角度也是如此。
Equinix全球IBX運營工程副總裁Arno van Gennip表示:「從設計到施工再到設施管理,數字孿生正成為提高數據中心效率和減少客戶碳排放的關鍵。」
數字孿生有助於將來自不同重點領域的數據集中到共享環境中,這使得IT、工程、財務、采購、施工團隊能夠在流程中,更早地 探索 和模擬性能、財務和環境等各種因素之間的權衡。設備和空間利用方面的各種效率提升,帶來的直接影響就是降低能耗和減少碳排放。數字孿生還有助於提高建設和運營效率,減少浪費、降低人員配備要求和相關環境影響。
很多企業和數據中心運營商(例如Nvidia)可能會從各種結合了工程、CAD和數據中心信息管理(DCIM)功能的模擬建模工具中打造出數字孿生工作流。越來越多的DCIM廠商(例如施耐德電氣)將數字孿生功能直接引入他們的工具中。達索系統和Future Facilities等廠商為數據中心提供了集成度更高的數字孿生。Nvidia等廠商也開始推出Nvidia Air這樣用於優化數據中心物理和邏輯布局的新工具。
投入運營中
Equinix與Future Facilities展開合作,面向企業數據中心構建數字孿生。數字孿生可以幫助工程師確保冷卻系統和連接生態系統提供所需的容量和最佳效率。工程師可以對比數據中心的預期行為和實際行為,以及能源使用的情況。
「這讓我們能夠深入了解有關維護和優化能源效率的各種可能性,」van Gennip說。
Equinix工程師和合作夥伴一起構建了物理數據中心的3D模型。這種數據中心孿生模型是基於各種因素建模的,例如數據中心內計算設備的容量和密度,以及冷卻銀虧液系統的路徑。集中式數字孿生平台可以幫助工程師使用實時數據(例如功率和溫度)預測預計的變更對配電、空間利用和冷卻路徑可能帶來的影響,這些實時數據整合到現有模型中,用於進行准確的分析和預測,從而使數據中心孿生可以通過預測能源需求提高效率。
達索和很多領先的超大規模數據中心企業展開合作,設計和建造下一代數據中心。
「他們面臨的最大挑戰就是如何縮短項目准備時間,以跟上不斷增長的需求,以及如何通過減少建設和運營期間的能源、水消耗和浪費,讓數據中心更具可持續性,」達索公司架構、工程和建築(AEC)行業銷售戰略總監Marty Rozmanith這樣表示。
讓管理更輕松
數據中心房地產投資信託公司Digital Realty的全球建築管理優化總監Kasper Dessing認為,以前數據中心管理被分成多個孤島,每個孤島都專注於管理設施的某一個方面。
因此,不同領域的管理者可能無法看到更大的格局。無論是現在還是將來,在考慮設施維護的時候,這一點都尤為重要。數據中心會產生大量的數據,而人類無法很好地捕獲、匯集和管理這些數據。隨著數字服務變得越來越復雜,這種情況只會變得越來鋒物越糟糕。
Dessing說:「通過數字孿生,我們能夠以虛擬的方式呈現設施內的各種元素和各種動態,以及在各種操作場景下實時模擬實際行為。」
Digital Realty發現,由於數據量龐大,並且不同組件之間存在相互依賴性,因此通用數據中心的運營情況還不夠好。正因為如此,Digital Realty將他們的設施數字孿生和專有的人工智慧和機器學習平台進行集成,分析數千個數據流,從而能夠跟蹤設施內的所有組件並進行實時調整,還可以對未來行為進行預測,從而展開預測性維護,節省空橋時間和降低成本。
這種對設施和不同組件之間關系的可見性,有助於改進新的設施設計,使其更高效。不僅如此,Digital Realty還利用數字孿生和他們的人工智慧平台來優化能源消耗。
Dessing說:「可持續性是我們的首要任務,優化每個設施的能耗有助於我們在降低成本的同時,減少對環境的影響。」
並非所有人都具備在決策的同時進行模擬的這一技術專長,因此,Digital Realty將一種推薦引擎集成到了他們的數字孿生平台中。
「這樣就可以讓更多的人使用該技術,而不必一直依賴專家。」
把碎片組合在一起
設計、建造和運營數據中心的過程中會產生大量的數據,這些數據被保存為不同的格式,存儲在不同的系統中。Rozmanith說,通過適當的訪問控制和變更管理來管理和組織數據,這非常有挑戰性。數字孿生可以帶來多個學科、不同發展水平(LOD)和多個維度的數據,這讓不同利益相關者可以實時地圍繞單一事實來源展開協作。那些更為復雜的數字孿生技術則結合了各種技術,使用一種集成數字孿生來模擬熱、結構、電氣、控制和監控、製造和組裝等過程。
Rozmanith解釋說:「有了一個通用的平台,所有人就都圍繞著單一事實來源展開工作,這不僅節省了時間,還提高了質量和整體數據中心交付能力。這個平台對我們來說就是一個變革的推動力。」
埃森哲雲首席技術專家Teresa Tung表示:「隨著我們整合更多數據和模擬來連接工程設計、施工調度和運營流程,不同的數字孿生之間的互操作性已經變成了一大挑戰。」
Tung的團隊正在與數據中心廠商展開合作,將數據和領域專業知識應用於分析過程中,以確定驅動假設預測所需的模擬數量和配置,他們使用領域知識圖(和用於互聯網搜索中的技術相同)來捕獲這些需求並映射不同元素之間的關系。
施耐德戰略計劃總監和解決方案架構師Carsten Baumann表示,提供商越來越多地向DCIM工具中添加數字孿生功能,以便在實際實施部署之前對基礎設施升級可能帶來的影響進行模擬。他認為,開放標准可以簡化數據中心設備和管理工具之間的集成,從而可以更輕松地將數字孿生作為日常數據中心工作流程的一部分。
下面就讓我們來詳細看一看,數字孿生提高設計、施工、運營和規劃可持續性的19種方式:
設計
放置新伺服器
「也許在數據中心行業,使用數字孿生技術帶來的最大影響就是氣流管理和IT設備放置問題了,」Baumann說。
部署計算、存儲和網路資源的需求快速增長,隨之而來的是基礎設施上的巨大挑戰。特定機架或者特定位置還有物理空間,並不意味著有足夠的電源、接入和散熱能力。
看似簡單的安裝部署,可能需要對電源進行重大升級或者更好的替代方案時,數字孿生就可以幫得上忙了。
增加密度
增加數據中心的設備密度,可以減少新設施對氣候帶來的影響。
Information Services Group(ISG)企業敏捷性總監Loren Absher表示,數字孿生有助於優化數據中心設計,改善電源、布線、冷卻要求、氣流甚至活動地板完整性等所有相關元素,以防止災難性故障的發生,此外還可以為增加密度所需的物理工作流程變更提供幫助。
提高熱性能
冷卻是數據中心的第二大能源消耗因素,僅次於設備本身。現代數據中心的冷卻系統包括冷卻器、管道和HVAC設備。
數字孿生可以使用熱模擬來了解冷卻系統的行為並提高其性能。
Rozmanith說,有些經常將代表冷水機組數量和管道尺寸變化的設備鏈的1D模擬,與氣流的3D計算流體動力學(CFD)分析結合起來,找到冷空氣和設備冷卻之間的最佳平衡,以優化能源消耗。
評估季節性影響
Techstrong Research董事總經理、聯合創始人Dan Kirsch表示,數字孿生還可以幫助數據中心設計師更好地規劃季節性氣候變化,讓設計師可以根據外部季節性氣候變化的影響提前規劃,以降低總體運營成本和能耗。
「數字孿生讓我們可以根據客戶的特定需求和現場條件進行真正的定製和優化設計,而無需進行實地實驗,」Kirsch說。
創建模塊化組件
達索與大型數據中心運營商展開合作,打造了可以在不同數據中心設計中重復使用的模塊化組件。
Rozmanith表示,數字孿生可以幫助企業定義和配置這些模塊的屬性,從而通過按訂單配置的方法,縮短設計、采購和安裝時間,從而有助於減少新建數據中心的環境影響。
測試和驗證設備
NTT全球數據中心美洲產品高級副總裁Bruno Berti表示,他們正在使用數字孿生來測試和驗證設備,然後再將其部署到數據中心內。
這些新的工作流程讓他們可以構建和測試電氣和發電機模塊,這樣工程師就可以在產品投入生產之前發生任何潛在的過程故障,減少了廢棄物對環境的影響並改進了風險評估,加速了新產品的開發,提高了數據中心的可靠性和彈性。此外,數字孿生還有助於安排預測性維護,降低維護成本。
優化電池性能
數據中心設備生產企業Vertiv的首席創新官Greg Ratcliff表示,數字孿生可以用於建模和設計系統,以改善電池 健康 狀況和預期壽命,從而減少製造新電池帶來的環境影響。在這種情況下,數字孿生可以幫助團隊使用電池 健康 測量和設施詳細信息,來模擬不同的設計選擇,預測每個電池的 健康 狀況和使用壽命。
Ratcliff表示:「如果電池組中的單個電池出現故障,那麼整個電池組都會出現故障,所以監控每個電池的運行狀況是至關重要的。」
評估環保型替代品
數據中心運營商可以利用數字孿生技術來評估新方法的性能、環境效益和潛在缺陷。
例如,Kao Data利用數字孿生工具來虛擬地測試和部署無製冷劑間接蒸發冷卻(IEC)系統,該系統使用水蒸發代替機械繫統在炎熱天氣冷卻空氣。這種方法幫助Kao Data提高了電力利用效率,減少了對環境的影響。
建築
精簡施工
數字孿生可以模擬復雜的任務、裝配、設備使用和人身安全,還可以改善供應商、集成商和承包商在設計和施工生態系統中的協作,以消除流程中的摩擦。
Rozmanith說,更好地模擬和協作,可以縮短施工時間、減少問題發生、避免返工、以及減少信息請求和安全事故的數量,這幫助達索的客戶將面市時間平均縮短了10-15%,減少了與施工時間較長可能帶來的環境影響。
減少建築垃圾
數據中心設計師正在使用數字孿生來更好地規劃施工,以便工作人員可以更高效地工作,減少浪費,縮短不同施工階段之間的時間。
Kirsch說:「通過創建數據中心的虛擬模型以及完整的材料清單,設計人員可以優化施工人員組裝數據中心的每一個細節。」
這種規劃方法可以減少一個團隊在其他團隊完成任務等候的時間。而通常來說,減少數據中心建設過程中的浪費並非易事,Kirsch說,這個過程中很多組件是無法重復使用或者回收的,最終只能進入垃圾填埋場。
運營
提供維護建議
數字孿生有助於確定問題的根本原因,並為快速修復提供維護建議,以減少能耗。
例如,Equinix位於阿姆斯特丹的工廠採用了一種數字孿生模型,根據模型顯示,他們必須清潔冷卻塔和調整風扇,以前這兩項維護的能耗都要高於模型預期的水平。van Gennip表示,數字孿生讓已經比較高效的數據中心IBX能源效率進一步提高了10%。
延長資產壽命
達索的虛擬數字孿生可以將人工智慧和機器學習演算法的操作數據情境化,用於改進預測性維護。Rozmanith說,這延長了設備的使用壽命,從而減少了電子垃圾。而且,虛擬孿生還可以通過提高冷卻和電力系統的效率來優化能源和水的使用。
提高維護和維修效率
數字孿生可以對維護、維修和翻新所需的所有信息訪問進行簡化,包括訪問文檔、用戶手冊、維護手冊、材料供應商信息和備件清單等信息。Vertiv定製空氣處理和模塊化解決方案副總裁Lorenz Hofmann表示,這可以節省時間和減少工作量,從而減少二氧化碳的排放量。
數據中心流程自動化
流程挖掘功能的改進,可以幫助數據中心領導者了解他們的團隊如何與應用進行交互,並對數據中心環境的變化做出反應。
ABBYY流程智能高級總監Ryan Raiker表示,使用數字孿生理解和記錄程序,有助於數據中心團隊發現候選的自動化方法,還可以實施不同的協議,以便在故障實際發生時採取行動,確保數據中心正常運行並減少故障和浪費的發生。
改善託管服務提供商和企業之間的協作
託管數據中心可以讓多個企業共享同一個數據中心,但是當企業客戶決定安裝新設備的事後,可能會對周邊其他企業的設備產生電力、熱量和重量上的影響。
法國Thésée DataCenter與Future Forward展開合作,在雲中部署每個設施的數字孿生,這種數字孿生讓客戶能夠通過Web服務端模擬他們自己或者附近設備預期變更可能帶來的影響,從而有助於Thésée的工程師與客戶展開協作,提高他們的數據中心空間使用率,減少建設新數據中心的需求。
規劃
確保滿足合規性要求
NTT正在研究通過數據孿生幫助企業收集與業務相關的數據,並對這些數據實施標准化。數據孿生將企業數據源及其相互關系復制為標准格式,為分析和報告提供一個集中的位置。
NTT Data Services SMART解決方案副總裁Bennett Indart表示,這將有助於提供數據中心在實現可持續發展目標方面取得的進展,以及發現新的機會進行改善。
改善財務決策
NTT公司的Berti表示,NTT已經開始把財務數據整合到他們的數字孿生中,這有助於NTT在計劃過程中使用實時數據和高級分析功能來審查材料和人工成本。
此外,這還有助於確定調整製造價值鏈從財務方面看是否合理,以及預期結果是否會降低數據中心的運營成本。
評估數據中心遷移帶來的影響
埃森哲與卡內基梅隆大學合作開發了一個名為myNav Green Cloud Advisor的數字孿生模型,該模型讓企業可以衡量數據中心和雲提供商之間遷移的可持續性影響。
埃森哲的Tung表示,該項目最開始是一個數字孿生,以當前數據中心的能源消耗、計算要求和可持續發展目標為基準,讓企業可以規劃和對比各種雲解決方案,包括碳排放目標、位置、能源和向清潔能源過渡的准備情況。
了解實質性的影響
Kirsch說,在建設完成之前,通常很難知道數據中心內的實際材料清單。在數據中心建設期間,團隊會遇到各種可能需要偏離最初設計的情況。設計團隊可以使用數字孿生規劃所有現場條件,並指定所需的材料。
Kirsch說:「通過制定準確的材料清單,數據中心創建者和最終用戶可以在施工開始之前就充分地了解需要使用的材料,以及對整體可持續性目標的影響。」
㈦ 數字孿生在新型智慧城市建設中的應用都有哪些
數字孿生在新型智慧城市建設中可以進行數字孿生流域建設、數字孿生排水管網、數字孿生橋梁防撞指揮等應用場景,進行數字化、精細化、可視化管理。
一、數字孿生流域政策環境:
2021年12月23日水利部召開推進數字孿生流域建設工作會議,水利部部長李國英提出:「數字孿生流域是以物理流域為單元、時空數據為底座、數學模型為核心、水利知識為驅動,對物理流域全要素和水利治理管理全過程的數字化映射、智能化模擬,實現與物理流域同步模擬運行、虛實交互、迭代優化」,同時強調以數字化、網路化、智能化為主線,以數字化場景、智慧化模擬、精準化決策為路徑,以算據、演算法、算力建設為支撐,加快推進數字孿生流域建設,實現預報、預警、預演、預案功能。
㈧ 如何在數字化轉型中推進和實施數字孿生
從2017年和2019年Gartner將數字孿生(Digital Twin)作為十大戰略性技術發布以來,數字孿生正在從虛擬產品生命周期管理、工業物聯網專業技術,發展為企業數字化的核心通用技術。作為企業數字化通用技術,數字孿生為企告液租業的運營創新、產品與服務創新、商業模式創新、管理創新帶來了新的機會,本文結合PLM、工業互聯網及企業領域數字孿生技術的發展演進探討如何規劃和實施企業數字孿生戰略。
數字孿生的技術演進:從虛擬產品技術到數字化戰略技術
2021年上海車展特斯拉車主維權事件中,特斯拉分別向市場監管部門、維權的張女士發送了整理為Excel表格的48頁6697組後台伺服器數據,詳細記錄了車主在事故前30分鍾的車輛狀況和駕駛動作。
特斯拉的用戶不僅可以通過特斯拉的數字孿生追溯設備的過去和當前使用狀況,還可以發現,在使用過程中,特斯拉 汽車 的功能似乎越來越智能,特斯拉 汽車 似乎會越來越懂你。特斯拉通過數字孿生給用戶提供了一種「持續智能」,可以持續適配用戶、持續優化。特斯拉通過這種服務,每年可以從每輛特斯拉獲得超過1200美元的收入。
要構建類似特斯拉這樣的數字化產品、服務和商業模式,首先需要理解數字孿生技術的由來、發展及持續演進。數字孿生迄今經歷了三個演進階段:
1、虛擬產品管理發展階段
2003年邁克爾·格里夫斯(Michael Greives)第一次提出將數字孿生(Digital Twin) 作為PLM的一個概念模型,將虛擬產品納入PLM的管理范疇,重新定義了PLM。到2011年NASA將「數字孿生」(Digital Twin)列入美國航空航天發展規劃,這個階段是數字孿生的概念形成階段。襪兆這個階段數字孿生主要被定位為下一代PLM系統的「虛擬完美模型」(Virtually perfect Model)。
2、工業互聯網發展階段
2011年以來,GE公司發布雄心勃勃的工業互聯網計劃,隨後,在GE和西門子、PTC等公司的倡導和支持下,數字孿生作為工業互聯網的核心技術得到了前所未有的重視,這個階段,無論是GE、PTC還是西門子,都不僅將數字孿生用於CAD、CAE、PLM等虛擬產品系統工程,還在設備(APM)、過程式控制制、網路等工業互聯網各個領域以數字孿生和數字主線作為核心技術支持,各個廠商分別發布了設備、網路、過程、產品、生產、運營等不同應用場景數以百萬計的數字孿生體。數字孿生通過工業互聯網的發展進入到商用階段,不過迄今大約只有1%的企業資產應用了數字孿生技術。
3、數字化戰略技術發展階段
2017年Gartner將數字孿生列入10大戰略技術趨勢,數字孿生從工業互聯網的核心技術進一步發展為基於物聯網的智慧城市和企業數字化的核心戰略技術。數字孿生作為戰略技術,從復雜系統工程(iMBSE)和工業互聯網等特定領域發展為智慧城市和企業的數字化基礎設施。Gartner數字孿生分為離散數字孿生、組合數字孿生、埋行組織數字孿生三個基本類型。產品數字孿生也好,設備數字孿生也好,實際都是一種離散的數字體,這樣的數字孿生的作用是局部的,Gartner的建議實際是將這種離散的數字孿生能力「組裝」起來,打造具備特定的業務模式和運營模式的組織數字孿生(DTO),讓企業具備數字孿生的持續智能能力。這樣,數字孿生就成為企業數字化的一種核心戰略技術。
數字孿生實施路線:從離散可視、數據驅動到持續智能
數字孿生的概念雖然出現已久,但是在企業數字化轉型中的應用還剛剛開始,即使引入數字孿生的企業也還處於試點和 探索 階段。但是在未來一年內,65%的大型企業都表示會投入啟動數字孿生項目。未來兩到三年,是企業數字孿生建設的戰略機遇期,有的放矢的擬定數字孿生戰略,無疑將獲得先行優勢。
目前推行數字孿生的製造企業,基本有兩條戰略實施路線,一條是從產品數字孿生開始,基於產品數字孿生,實現虛擬樣機、虛擬模擬,縮短產品研發周期,降低產品研發成本。典型代表是中車集團如中車株機;一條是設備和車間數字孿生開始,基於設備和車間數字孿生,實現透明化的裝備生產、運維和服務。典型代表是樹根互聯參與的三一重工8號工廠;
從企業戰略發展角度,為了實現通過數字孿生構建未來的競爭優勢,企業的數字孿生的戰略可以按照四個步驟展開:
1、第一階段:實現離散數字孿生的連接與可見
離散數字孿生,是實現設備、人員等單一的資源數據連接和數據可視以實現資源優化的單一數字孿生體。這一階段,基於邊緣網路技術、設備及資源管理系統,通過選定的設備、流程、系統的數字化連接和數據採集、數字化標識、數字化監測,實現數字化設備、流程和系統的診斷、描述性分析和預測;目前在不少企業推行的RPA(流程機器人)其實也是一種離散數字孿生的應用。設備的離散數字孿生未來將主要通過設備供應商提供;流程的離散數字孿生主要通過應用軟體服務商提供;
2、第二階段:實現復合數字孿生的互聯與數據驅動
復合數字孿生是基於內部離散數字孿生和外部數據資源復合而成的數字孿生體,如一條產線,一個端到端的服務線。數字孿生的復合過程不是簡單的數據互通,包括基於 歷史 數據的機器學習和模型訓練、基於實時數據的模型實時運行和監測。所以復合數字孿生的能力是需要通過一個包括AI和大數據能力在內的物聯網平台實現的。符合數字孿生一般通過企業個性化定製實現。
3、第三階段:實現企業數字孿生的數據驅動與持續智能
企業數字孿生(DTO)重點是面向企業全流程,通過數據孿生監測和驅動的業務運行,形成一種可以持續自動採集、自動分析、自主執行、自主決策的數據驅動閉環。在2020年的戰略技術趨勢預測中,Gartner提出了一個「持續智能」的新概念剛好可以解釋企業數字孿生的價值。持續智能指的是基於數字化在線平台實時獲取數據流,實時進行情景分析並給出響應方案,實現決策與運營的一體化。企業數字孿生的的建設是一個系統工程,基本的建設內容包括全價值鏈的數據獲取、模型構建、數據監測及支持持續智能的數據與分析平台建設。這種需求很多企業都是存在的,不過大多數企業因為不了解企業數字孿生的概念,可能將這個項目簡單等同於大數據中心。
4、第四階段:實現數字孿生的生態服務與價值共生
將產業上下游的數字孿生組織集合起來,就成為以鏈主為核心的產業數字孿生,如 汽車 製造商上下游數字孿生體集合起來就可以構成一個包括消費者、供應商、4S店及 社會 服務資源在內的 汽車 產業數字孿生。產業數字孿生將改變傳統的產業協同關系,衍生出全新的基於數據和智能的生他服務和價值共生模式。個性化訂制、網路化協同最終將體現在客戶參與數字孿生、生態夥伴共享產業數字孿生的價值。
數字孿生的創新策略:模型驅動、架構引領, 探索 中前進
從離散數字孿生,復合數字孿生到企業數字孿生、生態數字孿生,數字孿生在企業的應用深度不斷加深、實施的復雜性和應用的難度也會逐級加大。在實施的過程中必然面臨不確定的風險,在行業內實際還缺少行之有效的數字孿生實施方法。
在復雜系統工程領域,有基於模型的系統工程方法(iMBSE)對產品定義、領域建模與模擬給出了方法論指導;
在虛實融合的數字化方法論層面,德國工業4.0參考架構、中美工業互聯網參考架構也已經發表了發表了相關的架構框架。
但是在企業數字孿生領域,在面向企業運營和流程優化領域,原有的BPM(業務流程管理)的方法論已經不能支持模型驅動、虛實融合的數字化業務模式和運營模式創新需求,企業需要新的業務和運用模式優化方法論。
作者:金蝶軟體(中國)有限公司
組稿:李艾離
本文內容僅代表作者觀點,不構成購買或投資建議。
㈨ 從Siamse孿生網路到Sentence-BERT綜述
文兄空本匹配一直是自然語言處理(NLP)領域一個基礎且重要的方向,一般研究兩段文本之間的關系。文本相似度計算、自然語言推理、問答系統、信息檢索等,都可以看作針對不同數據和場景的文本匹配應用。
最近,我和小夥伴們參與了阿里天池「「新冠疫情相似句對判定大賽」,比賽任務:根據真實場景下疫情相關的肺炎、支原體肺炎等患者提問句對,識別相似的患者問題,就是典型的文本相似匹配應用。 截止3月18日,我們團隊在942支參賽隊伍中排名第四。
藉助比賽的機會,我重新系統梳理、總結了文本匹配的經驗方法。本文將著重介紹文本匹配任務中的經典網路Siamse Network,它和近期預訓練語言模型的組合使用,一些論文提及的調優技巧以及在此次比賽數據集上的效果檢驗等。
在正式開始介紹之前,我們先來看一個有趣的故事: 孿生網路的由來!
「Siamse」中的「Siam」襲塵森是古時泰國的稱呼,中文譯作暹羅,所以「Siamese」就是指「暹羅」人或「泰國」人。而「Siamese」在英語中是「孿生」的意思,這又是為什麼呢?請看下圖
十九世紀,泰國出生了一對連體嬰兒「恩」和「昌」,當時的醫學技術無法使兩人分離出來,於是兩人頑強地生活了一生。1829年他們被英國商人發現,進入馬戲團,在全世界各地演出,1839年他們訪問美國北卡羅萊那州成為「玲玲馬戲團」 的台柱,最後成為美國公民。1843年4月13日跟英國一對姐妹結婚,恩生了10個小孩,昌生了12個。1874年,兩人因病均於63歲離開了人間。他們的肝至今仍保存在費城的馬特博物館內。從此之後「暹羅雙胞胎」(Siamese twins)就成了連體人的代名詞,也因為這對雙胞胎全世界開始重視這項特殊疾病。
由於結構具有鮮明的對稱性,就像兩個孿生兄弟,所以下圖這種神經網路結構被研究人員稱作「Siamese Network」,即孿生網路。
其中最能體現「孿生」的地方,在於網路具有相同的編碼器(sentence encoder),即將文本轉換為高維向量的部分(詞嵌入)。網路隨後對兩段文本的特徵進行交互,最後完成分類/相似預測。「孿生網路」結構簡單,訓練穩定,是很多文本任務不錯的baseline模型。
孿生網路的具體用途是衡量兩個輸入文本的相似程度。例如,現在我們有兩個文本 text1 和 text2,首先將文本分別輸入 sentence encoder 進行特徵提取和編碼,將輸入映射到新的空間得到特徵向量 u和v;最終通過u、v的拼接組合,經過下游網路(比如全連接網路mlp)和激活函數來計算文本1和2的相似性。
整個過程有2個值得關注的點:
(1)在訓練和測試過程中, 模型的編碼器(sentence encoder)部分是權重共拍畝享的 ,這也是「孿生」一詞的體現之處。編碼器的選擇非常廣泛,傳統的CNN、RNN和Attention、Transformer都可以。
(2)得到特徵u、v後,可以直接使用距離公式,如cosine距離、歐式距離等得到兩個文本的相似度。不過更通用的做法是,基於u和v構建用於建模兩者匹配關系的特徵向量,然後用額外的模型(mlp等)來學習通用的文本關系函數映射;畢竟我們的場景不一定只是衡量相似性,可能還有問答、蘊含等復雜任務。
基於孿生網路,還有人提出了 Triplet network 三連體網路。顧名思義,輸入由三部分組成,文本1,和1相似的文本2,和1不相似的文本3。訓練的目標非常樸素,期望讓相同類別間的距離盡可能的小,讓不同類別間的距離盡可能的大,即減小類內距,增大類間距。
自從2018年底Bert等預訓練語言模型橫空出世,NLP屆的游戲規則某種程度上已經被大大更改了。在計算資源允許的條件下,Bert成為很多問題的優先選擇;甚至有的時候,拿Bert跑一跑baseline,發現問題已經被解決了十之八九。
但是Bert的缺點也很明顯,1.1億參數量(base版本)使得預測、推理速度明顯比CNN等傳統網路慢了不止一個量級,對資源要求更高,也不適合處理某些任務。例如,從10000條句子中找到最相似的一對句子,由於可能的組合眾多,需要完成49,995,000次推理計算;在一塊現代V00GPU上使用Bert計算,將消耗65小時。
考慮到孿生網路的簡潔有效,有沒有可能將它和Bert強強聯合取其精華呢?
當然可以,這正是論文 《Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks》 的工作,首次提出了 Sentence-Bert模型(以下簡稱SBert) 。SBert在眾多文本匹配工作中(包括語義相似性、推理等)都取得了最優結果。更讓人驚訝的是,前文所述的從10000條句子找最相似pair的任務,SBert僅需5秒就能完成!
讓我們簡短回顧此前Bert是怎麼處理文本匹配任務的。
常規做法是將匹配任務轉換成二分類任務(相似/不相似)。輸入的兩個文本拼接成一個序列(中間用一個特殊的符號「SEP」分割),經過12層(base-model)或24層(large-model)的multi-head Transformer模塊編碼後,將輸出層的字向量取平均或者取第一個token位置「CLS」的特徵作為句向量,經softmax完成最終分類。
但是論文作者 Nils Reimers 在實驗中指出,這樣的做法產生的結果並不理想(至少在處理語義檢索和聚類問題時是如此),甚至往往比Glove詞向量取平均的效果還差。
為了讓Bert更好地利用文本信息,作者們在論文中提出了如下的SBert模型結構。是不是非常眼熟?對,這不就是之前見過的孿生網路嘛!
SBert沿用了孿生網路的結構,文本的encoder部分用同一個Bert來處理。之後,作者分別實驗了CLS-token和2種池化策略(Avg-Pooling、Mean-Pooling),對Bert輸出的字向量進行進一步特徵提取、壓縮,得到u、v。最後的u、v整合,作者提供了3種策略:
(1)針對分類任務,對u、v拼接組合,最後接入一個mlp網路,使用softmax進行分類輸出,損失函數使用交叉熵;
(2)直接計算、輸出餘弦相似度;訓練損失函數採取了均方根誤差;
(3)如果輸入的是三元組,論文種也給出了相應的損失函數。
總的來說,SBert直接使用Bert的原始權重進行初始化,在具體數據集上微調,訓練過程和傳統Siamse Network差異不大。但是這種訓練方式能讓Bert更好的捕捉句子之間的關系,生成更優質的句向量。在評估測試階段,SBert直接使用餘弦相似度來比較兩個句向量之間的相似度,極大提升了推理速度。
有實驗為證!作者在7個文本匹配相關的任務上做了對比實驗,結果在其中的5個任務上,SBert都有更優表現。
此外,作者還做了一些有趣的消融實驗。使用NLI和STS為代表的匹配數據集,在進行分類目標函數訓練時,作者們測試了不同的整合策略,結果顯示「(u, v, |u-v|)」的組合效果最好,這裡面最重要的組成部分是元素差: (|u - v|) 。句向量之間的差異度量了兩個句子嵌入的維度間的距離,確保相似的對更近,而不同的對更遠。
此外,在Pool方法中,平均池化的效果要比另兩種方法更好。
完善的實驗過程幫助我們避免了不少坑。文章最後,作者對SBert和傳統的一些句嵌入方法做了對比,SBert的計算效率要更高一些。其中的smart-batching是論文中的一個小trick,先將輸入的文本按長度排序,這樣同一個mini-batch的文本長度更加統一,padding填充處理時能顯著減少填充的token。
我們將SBert模型在本次比賽的數據集上做了測試。使用數據增強後,線下的訓練集和驗證集數量分別是13,500和1000條句子組合。預訓練模型權重選擇的是roberta_wwm_large,訓練過程中加入了對抗訓練,通過在embedding層額外增加一些雜訊點提升模型的泛化能力。
最終SBert單模型在線下驗證集上的准確率是95.7%。直接使用Bert微調的方式,准確率為95.3%。
總的來說,我們做這次比賽的目的是為了積累更多的經驗,盡可能將學術界的前沿演算法和工業界結合,從而更好的將相關技術在實際項目中落地。
本文總體介紹了文本匹配任務中常用的網路結構Siamse Network,以及在此基礎上改進而來的Sentence-BERT模型。
Siamse Network 簡潔的設計和平穩高效訓練非常適合作為文本匹配任務的baseline模型,包括不限於問答對話、文本蘊含、文本相似等任務;如果孿生網路不能有效解決,可以再嘗試其他更復雜的模型。SBert則充分利用了孿生網路的優點和預訓練語言模型強大的特徵抽取優勢,在眾多匹配任務上取得了最優實驗結果。
拋開具體任務不談,SBert 可以幫助我們生成更好的句向量,在一些任務上可能產生更優結果。在推理階段,SBert直接計算餘弦相似度的方式,大大縮短了預測時間;在語義檢索、信息搜索等任務中預計會有不錯表現。同時, 得益於生成的高質量句嵌入特徵,SBert也非常適合做文本聚類、新FAQ發現等工作。