Azure 認知搜尋簡介
文章推薦指數: 80 %
Azure 認知搜尋(先前稱為「Azure 搜尋服務」) 是一項雲端搜尋服務,可為開發人員提供基礎結構、API 和工具,透過Web、行動和企業應用程式中的私人、 ...
跳到主要內容
已不再支援此瀏覽器。
請升級至MicrosoftEdge,以利用最新功能、安全性更新和技術支援。
下載MicrosoftEdge
其他資訊
目錄
結束焦點模式
閱讀英文
儲存
目錄
閱讀英文
儲存
Twitter
LinkedIn
Facebook
電子郵件
WeChat
目錄
什麼是Azue認知搜尋?
發行項
04/27/2022
9位參與者
此頁面有所助益嗎?
Yes
No
還有其他意見反應嗎?
系統會將意見反應傳送給Microsoft:按下[提交]按鈕,您的意見反應將用來改善Microsoft產品和服務。
隱私權原則。
送出
謝謝。
本文內容
Azure認知搜尋(先前稱為「Azure搜尋服務」)是一項雲端搜尋服務,可為開發人員提供基礎結構、API和工具,透過Web、行動和企業應用程式中的私人、異質性內容來建置豐富的搜尋體驗。
搜尋是向使用者呈現文字內容的任何應用程式的基礎,常見案例包括目錄或檔搜尋、線上零售或資料探索。
當您建立搜尋服務時,您將使用下列功能:
全文檢索搜尋的搜尋引擎,包含搜尋索引中使用者擁有內容的儲存體
豐富的索引編制,包含文字分析和選擇性AI擴充,用於進階內容擷取和轉換
豐富的查詢功能,包括簡單語法、完整的Lucene語法和typeahead搜尋
透過適用于.NET、Python、JAVA和JavaScript的AzureSDK中的RESTAPI和用戶端程式庫進行程式設計
資料層、機器學習層和AI(認知服務)的Azure整合
在架構上,搜尋服務位於包含未編制索引資料的外部資料存放區之間,以及將查詢要求傳送至搜尋索引並處理回應的用戶端應用程式。
在Azure平臺中,認知搜尋可以與其他Azure服務整合,其形式為索引器,以自動化從Azure資料來源擷取/擷取資料,以及整合認知服務的消費性AI的技能集,例如影像和自然語言處理,或是在AzureMachineLearning中建立的自訂AI,或包裝在AzureFunctions.
在搜尋服務內
搜尋服務中的兩個主要工作負載是「編製索引」及「查詢」。
編制索引是將內容載入至搜尋服務並使其可供搜尋的進入程式。
系統會在內部將輸入文字處理成權杖並儲存在反向索引中,以進行快速掃描。
您可以上傳JSON檔案格式的任何文字。
此外,如果您的內容包含混合檔案,您可以選擇透過認知技能新增AI擴充。
AI擴充可以擷取內嵌在應用程式檔中的文字,也可以藉由分析內容來推斷非文字檔中的文字和結構。
提供分析的技能是來自Microsoft的預先定義技能,或您建立的自訂技能。
後續的分析和轉換可能會產生先前不存在的新資訊和結構,為許多搜尋和知識挖掘案例提供高公用程式。
當用戶端應用程式將查詢要求傳送至搜尋服務並處理回應時,當索引填入可搜尋文字時,就可能發生查詢。
所有查詢執行都是在您建立、擁有並儲存在服務中的搜尋索引之上。
在您的用戶端應用程式中,搜尋體驗是使用Azure認知搜尋所提供的API來定義的,並可以包含相關性調整、自動完成、同義字比對、模糊比對、模式比對、篩選和排序。
透過簡單的RESTAPI或.NETSDK展現功能,並同時隱蔽資訊擷取固有之複雜性。
您也可以使用Azure入口網站進行服務管理和內容管理,以及搭配工具建立原型和查詢您的索引和技能集。
因為服務在雲端執行,Microsoft會管理基礎結構和可用性。
為何要使用認知搜尋?
Azure認知搜尋適用於下列應用程式案例:
將異質內容合併為使用者定義的私人搜尋索引。
將索引編制和查詢工作負載卸載至專用的搜尋服務。
輕鬆實作搜尋相關功能:相關性微調、多面向導覽、篩選(包括地理空間搜尋)、同義字對應和自動完成。
將大型未區分的文字或影像檔,或儲存在AzureBlob儲存體或CosmosDB的應用程式檔轉換成可搜尋的JSON檔。
這是透過可新增外部處理的認知技能,在編制索引期間達成。
新增語言或自訂文字分析。
如果您有非英文的內容,Azure認知搜尋可支援Lucene分析器和Microsoft的自然語言處理器。
您也可以設定分析器來完成原始內容的特殊處理,例如篩選出變音符號,或辨識並保留字串中的模式。
如需特定功能的詳細資訊,請參閱Azure認知搜尋的功能
如何開始使用
您可以在四個步驟中完成核心搜尋功能的端對端探索:
決定階層。
每個訂用帳戶允許一個免費的搜尋服務。
所有快速入門都可以在免費層上完成。
如需更多容量和功能,您需要計費層。
在Azure入口網站中建立搜尋服務。
從[匯入資料精靈]開始。
選擇內建範例或支援的資料來源,以在幾分鐘內建立、載入及查詢索引。
使用入口網站用戶端查詢您剛才建立的搜尋索引,完成搜尋總管。
或者,您也可以以不可部分完成的方式建立、載入及查詢搜尋索引:
使用入口網站、RESTAPI、.NETSDK或其他SDK建立搜尋索引。
索引結構描述會決定可搜尋內容的結構。
Upload使用「推送」模型從任何來源推送JSON檔的內容,或如果您的來源資料屬於支援類型,請使用「提取」模型(索引子)。
在入口網站、RESTAPI、.NETSDK或另一個SDK中使用搜尋瀏覽器來查詢索引。
提示
如需複雜或自訂解決方案的協助,請連絡具有認知搜尋技術深入專業知識的合作夥伴。
比較搜尋選項
客戶常會詢問Azure認知搜尋與其他搜尋相關解決方案有何差異。
下表摘要說明主要差異。
相較於
主要差異
Microsoft搜尋
Microsoft搜尋適用於需要在SharePoint中查詢內容之已通過Microsoft365驗證的使用者。
這是由管理員啟用和設定的立即可用搜尋體驗所提供,而且能夠透過Microsoft和其他來源的連接器接受外部內容。
如果這與您的案例相符,您可以了解搭配Microsoft365的Microsoft搜尋,這是一項不錯的選擇。
相反地,Azure認知搜尋會查詢您定義的索引,使用不同的來源填入您所擁有的資料與文件。
Azure認知搜尋可透過索引子為一些Azure資料來源提供編目程式功能,但您可以將任何符合您索引結構描述的JSON文件推送到單一、彙總的可搜尋資源。
您也可以自訂編製索引管線,以包含機器學習服務和詞彙分析器。
由於認知搜尋的本質是較大型解決方案中的外掛程式元件,因此您可以在任何平台上將搜尋整合到幾乎任何應用程式。
Bing
BingWeb搜尋API會在Bing.com上搜尋索引中符合您送出的項目。
索引是從HTML、XML和其他公用網站上的網站內容所建置。
根據相同的基礎,Bing自訂搜尋會為網站內容類型提供相同的編目程式技術,範圍設定為個別的網站。
在認知搜尋中,您可以定義和填入索引。
您可以使用索引子搜耙Azure資料來源上的資料,或將任何符合索引的JSON文件推送至您的搜尋服務。
資料庫搜尋
許多資料庫平台包括內建的搜尋經驗。
SQLServer有全文檢索搜尋。
CosmosDB與類似技術有可供查詢的索引。
對結合搜尋和儲存體的產品進行評估時,可能不容易決定要使用哪一個。
許多解決方案會同時使用兩者:具有儲存體的DBMS和具有特製化搜尋功能的Azure認知搜尋。
相較於DBMS搜尋,Azure認知搜尋會儲存異質來源中的內容及提供特製化文字處理功能,例如56種語言的語言感知文字處理(詞幹分析、詞形歸併還原、文字形式)。
它也支援拼錯字組、同義字、建議、評分控制項、Facet和自訂標記化的自動校正。
Azure認知搜尋中的全文檢索搜尋引擎的建置基礎為ApacheLucene,這是資訊擷取的業界標準。
不過,當Azure認知搜尋以反向索引的形式保留資料時,不會取代真實的資料儲存體,我們不建議在該容量中使用此形式。
如需詳細資訊,請參閱此論壇文章。
資源使用率是此類別中的另一項轉折點。
編製索引及某些查詢作業通常會耗用大量運算資源。
將搜尋從DBMS卸載至雲端中的專用解決方案,可保留用於交易處理的系統資源。
此外,將搜尋外部化可以輕鬆調整級別以符合查詢量。
專用的搜尋解決方案
假設您已決定使用具有全面功能的專用搜尋,最後就是要比較內部部署解決方案或雲端服務的範圍。
許多搜尋技術會提供編製索引和查詢管線的控制權、存取更豐富的查詢及篩選語法、控制順位和相關性,以及自我引導和智慧型搜尋的功能。
如果您想要擁有最少額外負荷和維護,還可調整級別的周全方案,雲端服務是正確的選擇。
在雲端範例中,數個提供者提供可比較的基準功能,其中包含全文檢索搜尋、地理空間搜尋,以及處理搜尋輸入中特定層級模棱兩可的情況。
是否最適合通常取決於特殊化功能,或API、工具和管理的容易性和整體簡單性。
就主要依賴搜尋來擷取資訊和導覽內容的應用程式而言,Azure認知搜尋在Azure上的內容存放區和資料庫處理全文檢索搜尋工作負載時,功能最強大,各個雲端提供者都是如此。
主要優點包括︰
在索引層)編目程式的資料整合(。
與信任連線AzureActiveDirectory的安全性整合,以及AzurePrivateLink整合,以支援無網際網路案例中搜尋索引的私人連線。
如果您需要讓無法搜尋的內容類型成為可搜尋的全文檢索搜尋,機器學習和AI與Azure認知服務整合非常有用。
56種語言的語言和自訂文字分析。
完整搜尋體驗:豐富的查詢語言、相關性微調和語意排名、多面向、自動完成查詢和建議的結果,以及同義字。
Azure規模、可靠性和世界級可用性。
在我們的客戶中,享有最多種Azure認知搜尋功能的客戶包括線上型錄、商務營運程式和文件探索應用程式。
觀看這部影片
在此15分鐘的影片中,檢閱Azure認知搜尋的主要功能。
本文內容