135 2295 6919
135 2295 6919
公司主站Website:
www.sdfoef.cn
電子郵箱:
qykh2009@163.com
公司地址:
北京市朝陽區亞運村天創世緣B2座30整層
Software 軟件百科
類別:網站建設訪問量:2214編輯:houwenqian 日期:2024-11-01 20:58:00
如果要想判斷一個C2C網站的好壞,首先要從系統構架的角度衡量一個搜索系統的高效性和擴展性。通過比較國內外優秀的電子商務網站看出,國內C2C網站的搜索技術與國外的搜索技術有較大的差距。這些差距不僅僅體現在技術細節上,更主要的是C2C網站管理系統系統架構的設計上。
C2C網站的搜索系統分為索引構建和搜索兩大部分。索引構建部分介紹了在C2C電子商務網站搜索系統中索引的構建過程。首先使用送料機提取商品信息,將處理過的商品信息送入搜索數據庫,然后由一個消息系統將商品更新以消息的形式發送給搜索引擎,搜索引擎建立索引,搜索引擎利用搜索關鍵字對商品在索引內進行搜索。
和人類不同,計算機不能夠理解人類自然語言文檔的結構,它們也不認識詞語和句子。對于計算機而言,一篇文檔只不過是一組0和l的序列。計算機不知道空格可以用來區分一篇文檔中的瑚與詞。因此,人們必須給計算機編程來區別詞與詞,這就是所謂的分詞。這樣的分詞程序常稱作分詞器或者解析器。
在C2C網站系統分詞過程中,解析囂需要知道如何確定這個代表的是一個詞,那個代表的是標點,還有一些不能打印的控制符。解析器還要能區分像郵件地址、電話號碼和URL等實體。在分詞的過程中,還需要存儲分詞的很多特性,如分詞的大小寫、語言編碼、詞性和位置等。
在C2C網站系統數據庫中,一個對象代表的是一個數據庫實體。用戶通過數據庫罩面的信息查找到與查詢條件相匹配的結果。根據應用的不同,查詢結果對象可以是文檔、圖片或者聲音。通常情況下這些文檔不是直接存儲在C2C網站的搜索系統中,而是存儲他們的應用或者原數據庫。太多數的C2C網站搜索系統都可以計算出每個結果與查詢條件的匹配度,并根據量化的匹配度對結栗對象進行評級,高級別的結果對琢可以顯示給用戶。如果用戶想優化查詢,這個查詢的過程可能需要多次反復。
再來分析一下C2C網站搜索系統竹后臺。C2C網站搜索后臺是牲個搜索系統的基礎,也是直接影響搜索系統性能的最關鍵部分。C2C網站搜索后臺的大部分功能都是圍繞著索引來的,所以可以把C2C網站搜索系統后臺再次分為兩個部分,即索引子系統和搜索予系統。索引子系統主要是為商品信息建立索引。C2C網站搜索子系統主要是從已有的商品索引中找到滿足查詢條件的商品。對于C2C網站搜索系統后臺來講,商品的數量是影響系統架構的主要因素之一。原因非常簡單,在C2C電子商務網站上,商品的修改非常頻繁,索引只能使用內存索引,不能使用磁盤索引。當商品索引的容量大于服務器的內存的時候,商品索引只能分布在多臺服務器上。索引的分布式存放比單一存放復雜的多,本文所研究的系統架構是基于分布式索引的系統架構。
【上一條】 沒有上一條
【下一條】 沒有下一條