第一篇:畫方科技_網絡輿情監測分析系統_產品白皮書.
網絡輿情監測分析系統 產品白皮書
北京融匯畫方科技有限公司 2012.09 版權聲明
北京融匯畫方科技有限公司版權所有,并保留有對本文檔及本聲明的最終解釋權和修改權。
本文檔中出現的任何文字敘述、文檔格式、插圖、照片、方法、過程等內容,除另有特別注明,版權均屬北京融匯畫方科技有限公司所有,受國家有關產權及版權法保護。任何個人、機構未經北京融匯畫方科技有限公司的書面授權許可,不得以任何方式復制或引用本文檔的任何片段。
畫方科技是北京融匯畫方科技有限公司的注冊商標,受商標法和有關國際公約的保護。
免責條款
畫方科技公司在本文中盡可能提供確定的信息,但不會為信息的完整性和正確性承擔責任。除非有書面協議,本文所述畫方科技公司的產品信息并不代表任何保證或正式的承諾。更多的資料可以向畫方科技公司索取。
支持信息
本資料將定期更新,如欲獲取最新資料,或更多畫方科技相關產品信息、解決方案以及其它網絡、信息安全相關的軟、硬件產品信息,敬請訪問畫方科技公司網站:http://www.tmdps.cn,或發送電子郵件到product@huafoun.com,或致電畫方科技垂詢。
北京融匯畫方科技有限公司
地址:北京市海淀區花園路13號汗太華大廈三層 郵編:100021 電話:86-10-84928311 傳真:86-10-84828038 目錄 1背景(4 2系統概述(4 2.1產品理念(4 2.2工作流程(5 2.3產品意義(6 3產品功能(6 3.1輿情規劃(6 3.2輿情信息采集(6 3.3輿情信息加工(7 3.4元搜索功能(8
3.5輿情專題(8 3.6輿情分析(9 3.6.1輿情分布圖(9 3.6.2輿情趨勢圖(9 3.7輿情報告(9 3.8分級權限管理(9 3.9用戶管理(9 3.10關鍵字管理(10 3.10.1事件關鍵字管理(10 3.10.2領導人關鍵字管理(10 3.10.3色彩關鍵字管理(10 3.11手工添加輿情(10 3.12輿情報警(10 3.13智能終端(11 4系統特點(11 1背景
當今,互聯網世界已經滲透到現實社會的各個角落。極大的擴大了人類實踐活動的范圍。且互聯網世界的開放性和匿名性使得人們更親睞于通過網絡來表達自己的內心世界,更直接更坦誠的發表觀點。在互聯網快速發展的今天,網絡媒體已經成
為一種信息的主要傳播途徑,其開放、虛擬的特性讓言論達到了前所未有的活躍程度。在論壇、博客、微博等非受控渠道是目前發表個人觀點的主要方式。
我們在受益于互聯網世界的同時,也會為因此產生的網絡憂患而擔憂?;ヂ摼W是先進文化供給與傳播的重要手段,是反映社會輿情的主要載體之一,是網絡輿情產生的聚集地,卻也是危機事件引發的根據地。對于公眾關注的事件很快就會形成網上輿論,個別人在其中煽風點火,極易造成網絡非理性情緒蔓延,進而產生嚴重的不良影響,對相關部門造成巨大的輿論壓力??梢哉f,互聯網已成為思想文化信息的集散地和社會輿論的放大器。
2系統概述
畫方科技輿情監測系統一共包括三個模塊:網絡輿情采集系統、輿情分析引擎和輿情應用服務系統。提供相關輿情、負面輿情、預警信息、熱點信息的發現、主題事件監測、分類監測、輿情監管、統計分析、輔助決策支持等多層次、多維度的輿情信息服務。根據用戶的網絡輿情監測和定向追蹤等信息需求,形成簡報、報告、圖表等分析結果,從而幫助用戶及時掌握輿情動向。為領導和輿情工作部門提供信息參考和決策支持。
對不同政府、企業和行業監管等職能部門而言,輿情監測的需求既有通用性,也有個性化的特點存在,畫方科技輿情監測系統具有極大的擴展性,凡是需要對輿情、口碑關注的政府、企業、高校和其他組織機構都可以通過本系統進行量身打造,建立適合自己的輿情監測體系。
2.1產品理念
“及時發現”是輿情監測系統的核心功能,效果是輿情監測系統的靈魂 ?定向采集和全網搜索相輔相成,按照輿情的傳播規律構建立體監測體系,疏 而不漏
?管線架構,輿情漏斗分析模型,分析粒度粗細可控
?技術結合實踐,千錘百煉,功能設計實用至上
?在輿情監測領域,普遍存在著產品功能與客戶需求之間的差距,很多公司回 避這個難點,不再提倡輿情監測的概念,而是當做一個大而全的管理系統去 做。我們認為,現階段,輿情工作的重點仍然是輿情監測,提供及時、全面、準確的輿情監測是輿情監測系統的靈魂。不抓住這一靈魂,也就失去了輿情 監測在現階段存在的意義和作用。因此,我們做輿情的產品理念就是:按照 輿情的傳播規律構建監測體系,立體監測、及時更新、準確分析、合理展現。真正起到輿情監測的作用,提高輿情應對和管理的質量和效率,為輿情管理 和領導決策服務。2.2工作流程
(1信息采集系統從互聯網上采集新聞、論壇、博客、評論等輿情信息,存儲到采集信息數據庫中。
(2輿情分析引擎負責對采集信息進行清洗、智能研判和加工,分析結果保存在輿情成果庫中。輿情分析引擎依賴于智能分析技術和輿情知識工程。
(3輿情服務平臺把輿情成果庫中經過加工處理的輿情數據發布到Web界面上并展示給用戶。
(4用戶通過輿情服務平臺瀏覽輿情信息,通過簡報生成等功能完成對輿情的深度加工和日常監管工作。
2.3產品意義
科學的進步及在科研領域的應用,解決了天氣無法預報的難題;技術的發展及信息化工具的誕生使網絡輿論提前發現成為可能;
3產品功能 3.1輿情規劃
針對組織關注的板塊不同,對采集范圍及關鍵字進行整體規劃,分類管理;能夠結合當前熱點話題及輿情動態,實時調整輿情采集點;3.2輿情信息采集
信息采集是輿情工作的首要任務,互聯網傳播特點和網民行為特征要求系統全面獲取網絡信息,信息時效性要求系統及時采集到網絡信息。
系統內置數千個影響程度大、傳播面廣、網民參與度高的網站,從廣度和深度全面抓取信息;1各大門戶網站:由資訊性質網站和網絡媒體構成,如新浪網、雅虎網、網 易、搜狐網……
2各大行業網站:由行業性質網站構成,如行業資訊網站、政府門戶網站、行業企業網站……
3交互性質網站:有各種形式的論壇、貼吧、BBS、留言板構成,如水木清 華BBS、天涯、新浪BBS……
4各大搜索引擎網站:同步百度和Google的搜索結果。5各種微博:網易、天涯、騰訊、新浪、鳳凰網……
6境外網站:星島環球網、星島日報、聯合早報、韓國聯合通訊社…… ◆優先級信息采集,對不同影響力的網站配置不同優先等級,優先級高的網站 優先采集信息,從信息源影響力角度確保重要輿情及時傳遞;◆信息采集形式全面,不同輿情源采用不同采集方式保障采集實時性;3.3輿情信息加工
系統按照各信息源表現出的網頁形式呈現采集信息,網頁上包含大量的廣告、圖片、鏈接,這些不是輿情關注的價值信息,還給系統的高效運行、檢索增加負擔。同時數據呈現按照各自信息源排列規則出現,需要系統分別去識別標題、來源、作者、發布時間、正文等,要求對信息預處理形成統一格式供后續的決策分析。預處理包含超鏈分析、編碼識別、URL去重、錨文本處理、垃圾信息過濾、關鍵字抽取、關鍵信息提取、正文抽取、自動摘要;
◆雙重過濾機制
網絡輿情監測分析系統產品白皮書 網查閱,兼容性好且保證信息查閱的方便性。
4、輿情簡報方便:支持輿情簡報 HTML、自定義簡報格式,支持簡報生成 word 格式,方便日常輿情簡報的編輯、打印上報。
5、系統管理(高安全性)USB-KEY 認證方式保證只有持有管理 KEY 的人員才能 : 登錄系統進行管理,這樣防止因為用戶名密碼的泄露而造成管理上的漏洞。
6、功能管理(高開放性):整個系統基于開放式的模塊管理方式,用戶可以完 全自定義系統主模塊位置、名稱,可以自行開發新的應用并通過 “模塊管理” 功能無縫集成。
7、展示管理(高靈活性):用戶也可以按照自己的工作習慣任意調試子模塊的 位置和名稱,輿情展示界面可以自由拖拽。用戶可以方便的構建一個個性化 的輿情系統。
8、輿情信息自動采集:支持定時計劃采集,支持 1 小時粒度自動采集,保證非 工作時間內信息的收集正常運行,定義方式靈活、策略豐富、智能化程度高。
9、敏感內容自動分析:能對定義目標的鏈接標題及文章內容進行自動分析,涉 及敏感信息會自動分類,同時進行敏感信息報警。
10、輿情專題自動聚類:支持對熱門、敏感的輿情進行自動聚類,可自定義輿情 專題,并對輿情專題進行一周趨勢分析,對關注輿情的熱度進行跟蹤。
11、支持 3G 智能手機:充分結合現在的 3G 網絡,畫方科技推出了支持目前 3G 應用的智能手機客戶端的系統,保證工作人員的移動性。同時客戶端和智能手機 底層消息系統集成,有消息的啟用手機消息通知,非常方便實用。
第二篇:基于網絡輿情監測系統的分析
基于網絡輿情監測系統的分析
[摘 要] 隨著互聯網的快速發展,網絡媒體作為一種新的信息傳播形式,已深入人們的日常生活。網民數量的持續快速的增加,以及網民通過網絡形成的輿情越來越得到社會的廣泛的關注。網絡輿情監測系統就是針對網絡輿情熱點問題的預警。
[關鍵詞] 網絡輿情 監測 分析
隨著互聯網的快速發展,網絡媒體作為一種新的信息傳播形式,已深入人們的日常生活。中國網民數量也在持續快速的增加,2010年7月15日,中國互聯網絡信息中心(CNNIC)發布《第26次中國互聯網絡發展狀況統計報告》,報告顯示,中國網民規模達到4.2億,手機網民民規模更達2.77億。網民通過網絡形成的輿情越來越得到社會的廣泛的關注。從2003年的非典、孫志剛事件,到2010年教育局封殺論壇事件、馬鞍山局長打人事件等等。這些事件性質、主體各不相同,但是有一個共同的特點,即他們都是通過網絡而放大了事件的影響力。
1.網絡輿情監測系統的概念
網絡輿情是通過互聯網傳播的公眾對現實生活中某些熱點、焦點問題所持的有較強影響力、傾向性的言論和觀點。
最近幾年各種社會機構組織、企業、各級政府都紛紛重視網絡輿情,2008年7月,江西60多位縣級官員實名開博,多數是收集當地網民關注的民生問題。2010年9月8日,人民網?中國共產黨新聞網正式推出“直通中南海――中央領導人和中央機構留言板”。該留言板突出互動性,旨在讓廣大網友對中央領導人傾訴心聲,給中央機構提出意見和建議。
由于互聯網具有虛擬性、隱蔽性、發散性、滲透性和隨意性等特點,越來越多的網民樂意通過BBS論壇、博客、新聞跟貼和轉貼等渠道來表達觀點傳播思想。如果引導不善,負面網絡輿情將對社會公共安全形成威脅。對相關部門來說,加強對網絡輿論的及時監測、有效引導,以及對網絡輿論危機的積極化解,對維護社會穩定、促進國家發展具有重要的現實意義,也是創建和諧社會的應有內涵。對企業來說,準確掌握產品和市場情況,監控競爭對手和行業動態,是企業市場、行銷決策的重要支撐。
從現在的網絡輿情傳播速度來看,信息出現后的1至3小時就可以被轉至多家論壇,6小時后就可以被多家新聞網站轉載,24小時在網上的評論和跟帖就能制造出熱點事件和輿論高潮。因此能夠第一時間知道現在哪些是熱點輿情,哪些將會成為熱點輿情,對于我們來說至關重要。
“網絡輿情監測系統”是針對在一定的社會空間內,圍繞中介性社會事件的發生、發展和變化,民眾對社會管理者產生和持有的社會政治態度于網絡上表達出來意愿集合而進行的計算機監測的系統統稱。通過這個系統,能夠讓我們有效的對網絡輿情進行預警和應對。
2.網絡輿情監測系統結構
網絡輿情監測系統分為五大系統,分別是:網絡輿情采集系統、網絡輿情存儲系統、網絡輿情分析系統、網絡輿情檢索系統和網絡輿情發布系統。如圖1:
網絡輿情采集系統會對互聯網中的主要門戶網站新聞、各大論壇的熱門貼、關注度比較高的博客和微博以及各大主要的網絡搜索引擎的熱搜內容進行采集。采集后的數據存儲進入統一的網絡輿情存儲系統。網絡輿情分析系統對存儲在輿情存儲系統中的信息進行分析,把輿情內容歸納、整理、分類后得出最近階段輿情的變化及趨勢,并把分析好的數據存入存儲系統。用戶可以用網絡輿情檢索系統檢索自己想要的最近、最新的焦點信息。最后通過輿情分析系統分析的信息、通過輿情檢索系統檢索的信息以及網絡輿情存儲系統中的信息都可以通過輿情報告系統發送和展示給用戶。
3.網絡輿情監測系統分析
3.1網絡輿情采集系統
網絡輿情采集系統是整個系統的基礎。全世界互聯網的信息是非常巨大的,即使僅僅對國內信息的檢索也是海量的,而且由于網頁設計的靈活性造成的網頁結構復雜,網頁的快速更新造成的網頁內容動態性,以及一些網站對站內信息限制的技術手段造成網頁內容不完整性,使得傳統手工采集信息的方法非常低效率和高錯誤率。特別是最近幾年,隨著QQ群、博客、twitter等微博被網友廣泛使用,這些主要為松散的,非結構化信息要實現采集的難度也越來越大,靠手工采集已經不太現實。
為解決這個問題,現在的采集系統往往采用具有一定智能的自動采集技術,國內外早期的網絡采集方法是針對特定采集對象編寫的程序,這個程序稱為wrapper。近幾年,越來越多的采集工具被開發出來用來代替傳統的手工編寫wrapper程序的方法。目前較為流行的采集工具可以分為六大類:
3.1.1開發wrapper的專用高級語言
傳統的wrapper由于是手工編寫針對某一個目標,如果要為大量目標手工編寫非常不效率,通過專用高級語言可以方便編寫wrapper。例如:Minerva,TSIMMIS,Web-OQL,FLORID,Jedi等。
3.1.2以HTML為中間件的工具(HTML-aware Tools)
這些工具在抽取時主要依賴HTML文檔的內在結構特征。在抽取過程之前,這些工具先把文檔轉換成標簽樹;再根據標簽樹自動或半自動地抽取數據。代表工具有Knowlesys,MDR。
3.1.3基于NLP(Natural language processing)的工具(NLP-based Tools)
這些工具通常利用filtering、part-of-speech tagging、lexical semantic tagging等NLP技術建立短語和句子元素之間的關系,推導出抽取規則。這些工具比較適合于抽取那些包含符合文法的頁面。代表工具有 RAPIER,SRV,WHISK。
3.1.4包裝器的歸納工具(Wrapper Induction Tools)
包裝器的歸納工具從一組訓練樣例中歸納出基于分隔符的抽取規則。這些工具和基于NLP的工具之間最大的差別在于:這些工具不依賴于語言約束,而是依賴于數據的格式化特征。這個特點決定了這些工具比基于NLP的工具更適合于抽取HTML文檔。代表工具有:WIEN,SoftMealy,STALKER。
3.1.5基于模型的工具(Modeling-based Tools)
這些工具讓用戶通過圖形界面,建立文檔中其感興趣的對象的結構模型,“教”工具學會如何識別文檔中的對象,從而抽取出對象。代表工具有:NoDoSE,DEByE。
3.1.6基于本體的工具(Ontology-based Tools)
這些工具首先需要專家參與,人工建立某領域的知識庫,然后工具基于知識庫去做抽取操作。如果知識庫具有足夠的表達能力,那么抽取操作可以做到完全自動。而且由這些工具生成的包裝器具有比較好的靈活性和適應性。代表工具有:BYU,X-tract。
3.2網絡輿情分析系統
網絡輿情分析系統為整個系統的核心功能,其主要包括以下功能:熱點識別能力、聚類分析、傾向性分析與統計、信息自動摘要功能。
3.2.1熱點識別能力
由于網絡信息的更新和變化速度非常快,導致網絡熱點也時常轉化,因此識別熱點成為整個分析系統的前提條件。一般對于一段時間內的熱門話題的識別主要是根據信息出處權威度、評論數量、發言時間密集程度等參數,給予一定的權重值,然后統計出該時間段內的熱點。
3.2.2聚類分析
傳統的手工統計分析對于海量的數據基本是無能為力,即使是勉強統計也會因為數據量而對數據的主題把握會產生偏差,從而造成統計數據失真,進而造成分析結果錯誤。
對文章標題和關鍵詞進行聚類分析是現在常用的網絡輿情分析方法,現在被廣泛的采用,常用的聚類分析方法一般分為五類:
3.2.2.1劃分方法
首先創建k個劃分,k為要創建的劃分個數;然后利用一個循環定位技術通過將對象從一個劃分移到另一個劃分來幫助改善劃分質量。典型的劃分方法包括:k-means,k-medoids,CLARA,CLARANS,FCM。
3.2.2.2層次方法
創建一個層次以分解給定的數據集。該方法可以分為自上而下(分解)和自下而上(合并)兩種操作方式。為彌補分解與合并的不足,層次合并經常要與其它聚類方法相結合,如循環定位。典型的這類方法包括:BIRCH方法,它首先利用樹的結構對對象集進行劃分;然后再利用其它聚類方法對這些聚類進行優化。CURE方法,它利用固定數目代表對象來表示相應聚類;然后對各聚類按照指定量(向聚類中心)進行收縮。ROCK方法,它利用聚類間的連接進行聚類合并。CHEMALOEN方法,它則是在層次聚類時構造動態模型。
3.2.2.3基于密度的方法
根據密度完成對象的聚類。它根據對象周圍的密度(如DBSCAN)不斷增長聚類。典型的基于密度方法包括:DBSCAN:該算法通過不斷生長足夠高密度區域來進行聚類;它能從含有噪聲的空間數據庫中發現任意形狀的聚類。此方法將一個聚類定義為一組“密度連接”的點集。OPTICS:并不明確產生一個聚類,而是為自動交互的聚類分析計算出一個增強聚類順序。
3.2.2.4基于網格的方法
首先將對象空間劃分為有限個單元以構成網格結構;然后利用網格結構完成聚類。STING就是一個利用網格單元保存的統計信息進行基于網格聚類的方法。CLIQUE和Wave-Cluster 則是一個將基于網格與基于密度相結合的方法。
3.2.2.5基于模型的方法
它假設每個聚類的模型并發現適合相應模型的數據。典型的基于模型方法包括:統計方法COBWEB:是一個常用的且簡單的增量式概念聚類方法。它的輸入對象是采用符號量(屬性-值)對來加以描述的。采用分類樹的形式來創建一個層次聚類。CLASSIT是COBWEB的另一個版本。它可以對連續取值屬性進行增量式聚類。
3.2.3傾向性分析與統計
對信息的闡述的觀點、主旨進行傾向性分析??梢詾榫W絡輿情的分析提供參考依據。
但是由于網絡詞匯的多樣性,網絡上出現許多新詞,要判斷這些詞的傾向性就比較困難,一般傾向性分析可分為三種:
3.2.3.1情感傾向詞典
中文詞語情感傾向詞典是給定一組已知極性的詞語集合作為種子,對于一個情感傾向未知的新詞,在電子詞典中找到與該詞語義相近、并且在種子集合中出現的若干個詞,根據這幾個種子詞的極性對未知詞的情感傾向進行推斷。
3.2.3.2機器人學習
與詞典法比較類似,也是給予一些已知極性的詞語作為種子詞,對于一個新詞根據它和種子詞的緊密程度對其情感傾向性進行推斷,不同的是他是根據詞語在種子庫中的同現情況判斷其聯系緊密程度來作為判斷依據。
3.2.3.3人工標注種子庫
首先對情感傾向性分析種子庫進行手工標注,標注的級別包括文檔集的標注、短語級標注和分句級標注。在這些基礎上,利用詞語的共現關系、搭配關系或者語義關系,以判斷詞語的情感傾向性。
3.2.4信息自動摘要功能
能夠根據文檔內容自動抽取文檔摘要信息,這些摘要能夠準確代表文章內容主題和中心思想。用戶無需查看全部文章內容,通過該智能摘要即可快速了解文章大意與核心內容,提高用戶信息利用效率。而且該智能摘要可以根據用戶需求調整不同長度,滿足不同的需求。主要包括文本信息摘要與網頁信息摘要兩個方面。
3.3網絡輿情檢索系統
網絡輿情檢索分析系統產生的結果會實時存放進入存儲系統之中,而檢索系統可以分時間、地點、類型、網站等等進行分類檢索,然后提供給用戶。
分析系統提供的熱點分析往往只是對已經產生的熱點,或者是將要成為熱點的次熱點。而檢索系統還可以讓用戶自定義關鍵詞對采集到的信息進行自定義監控。
3.4網絡輿情報告系統
根據網絡輿情分析系統處理后的結果或網絡輿情檢索系統查詢的結果生成報告,系統可通過短信、電話、網頁瀏覽等各種手段及時告知,提供決策支持。
總之,網絡輿情監測系統出現時間還比較短,基于其的算法和方法還都很不完善,而且隨著計算機技術的不斷發展,網絡應用技術也在不斷的變化,像近幾年微博等非結構性的應用形式的出現,給檢測系統的監測帶來不小的挑戰。方便、快捷、智能、通用將是今后輿情監測系統發展的方向。
參 考 文 獻
[1]曹勁松.政府網絡傳播[M].江蘇:江蘇人民出版社,2010-11-02
[2]葉皓.正確應對網絡事件[M].江蘇:江蘇人民出版社,2009
[3]郭建永,蔡永,甄艷霞.基于文本聚類技術的主題發現[J].計算機工程與設計,2008(6).■
第三篇:國內網絡輿情監測系統對比分析
國內網絡輿情監測系統對比分析
目前,國內市場上進行網絡輿情監測系統的企業如雨后春筍般迅速發展,下面我們主要分析一下現今市面上比較常見的,占有率比較高的幾大品牌。
針對國內的幾大廠商,不妨先說一下泰一輿情監測軟件,這也是我比較看好的一家輿情監測廠商,其本身的輿情監測系統相對于“軍犬”“谷尼”“Rank”來說相當出彩,與三大運營商深度合作,100萬定向抓取源搜索引擎,采用智能爬蟲技術,全網監測新聞、論壇、博客、微博、電視等各類型媒體,全天7*24小時實時抓取,確保信息全面,無遺漏。從客戶需求出發,對信息進行全面抓取的同時,及時發現負面信息,并對之做出及時正確的反應,以提升單位、企業形象。
反觀其他廠商,對于中科點擊旗下“軍犬網絡輿情監測系統”,該公司從信息采集起家,其主要產品應該是它的“軍犬網絡信息采集系統”,該系統的短處在文本語意分析方面:只能根據關鍵詞進行關注(敏感)信息的匹配,不能形成輿情熱點,功能稍有局限。接著說谷尼國際的輿情系統,總體感覺一般,沒有很出彩的地方,文本分析能力也很一般,除了互聯網上能看到他們的信息,市場上基本看不到它參與競爭。而Rank則是廣告打的非常響亮,實力稍顯一般。
總之,就整體而言,泰一輿情較其他廠商更加有優勢。有輿情監測需求的廠商不妨去百度一下,具體了解其特點!
第四篇:國內網絡輿情監測系統對比分析
國內網絡輿情監測系統對比分析
目前,國內市場上進行網絡輿情監測系統的企業如雨后春筍般迅速發展,下面我們主要分析一下現在市面上比較常見的,占有率比較高的幾大品牌。
針對國內的幾大廠商,最值得一提的是泰一輿情監測軟件,這也是我比較看好的一家輿情監測廠商—泰一指尚,其本身的輿情監測系統相對于“軍犬”“谷尼”“Rank”來說十分出彩,與三大運營商深度合作,100萬定向抓取源搜索引擎,采用智能爬蟲技術,全網監測新聞、論壇、博客、微博、電視等各類型媒體,全天7*24小時實時抓取,確保信息全面,無遺漏。從客戶需求出發,對信息進行全面抓取的同時,及時發現負面信息,并對之做出及時正確的反應,以提升單位、企業形象。
反觀其他廠商,對于中科點擊旗下“軍犬網絡輿情監測系統”,該公司從信息采集起家,其主要產品應該是它的“軍犬網絡信息采集系統”,該系統的短處在文本語意分析方面:只能根據關鍵詞進行關注(敏感)信息的匹配,不能形成輿情熱點,功能稍有局限。接著說谷尼國際的輿情系統,總體感覺一般,沒有很出彩的地方,文本分析能力也很一般,除了互聯網上能看到他們的信息,市場上基本看不到它參與競爭。而Rank則是廣告打的非常響亮,實力稍顯一般。
總之,就整體而言,我傾向于推薦國內的泰一輿情。
第五篇:奧搜互聯網輿情信息監測系統白皮書
北京杰諾在線科技有限公司
輿情信息監測系統
白皮書
北京杰諾在線科技有限公司
http://www.aosou.net全國統一咨詢電話:400-656-0601
北京杰諾在線科技有限公司
目 錄
杰諾在線輿情監測系統............................................3
一、系統說明...................................................3
二、系統架構...................................................4
三、軟件特點...................................................4
四、軟件功能...................................................4
(2)功能特點................................................5(3)特點....................................................6
五、輿情加工...................................................8
六、輿情規劃..................................................13
七、輿情服務..................................................14
八、評估反饋..................................................16
九、服務器要求................................................17
十、性能指標..................................................18
前 言
“互聯網不完全是一個虛擬的世界,它的本質是現實的。互聯網面向公眾,直接對社會產生影響?!眹鴦赵盒侣勣k公室副主任蔡名照曾這樣描述互聯網與社會的關系。我們還應該看到,在我國,互聯網的受眾是一個特殊的群體,因為占大多數的農民、民工都不使用互聯網,由于互聯網在我國傳播的歷史原因,稍長年齡段的人對互聯網的使用也并不熟悉。因此,互聯網直接面向公眾,也就是具有局限性的這個公眾,對社會影響的力量是有限的。
通過近期對本地BBS信息的觀察發現,相當多的言論已經不是滿足于一些日常生活的需要,而是在試圖去喚起大眾的注意,去改變令人不滿意的現實狀況。特別是對社會生活中出現的一些不正常現象,進行了尖銳的批判和抨擊。
全國統一咨詢電話:400-656-0601
北京杰諾在線科技有限公司
C.自動分類,聚類
D.網頁非結構化信息抽取
E.基于語義分析的高級分詞技術
F.信息指紋去重
G.多語言、編碼格式自動識別
H.搜索引擎與數據庫無縫集成 I.圖片搜索
J.分布式系統、支持億級數據檢索
K.智能摘要、關鍵字提取技術(2)功能特點
A.信息實時監測
通過信息實時監測,可以分區域,按關鍵詞,IP段進行實時監測
在快捷菜單中也可以對設置關鍵詞匯,預警級別,監控網站,刷新速率,監控深度,郵件發送人,手機接收人等參數設置 B.自動聚類、分類
自動分類聚類功能,可以將信息監測搜索到的信息進行處理,幫助用戶對數據進行 信息整理,系統支持人工分類和自動學習功能,也支持基于統計模型的自動分類。
C.監控管理
用戶可以自行設置監控的關鍵詞匯或語句,并可根據詞語進行分類,例如:氣候變化等。并可以設置即時發現后對敏感詞匯的處理方式,以email或短信方式實時提醒。保留原始網頁快照以備追蹤熱點信息,自動收集最新熱門關鍵詞匯(即熱門話題)D.統計分析
分布統計:通過圖表展示監控詞匯和時間的分布關系以及趨勢分析,包括地域信息分布。
熱點統計:根據時間統計熱點的分類和熱門關鍵詞,包括地域信息分布。
預警信息:對于敏感信息和預警級別重點信息監控。
信息報告:智能和人工生成信息報告,支持報告導出功能。
E.多用戶和分級
支持用戶管理,不同用戶可以設置不同的監控源以及監控關鍵詞匯,預警提醒等相關信息參數設置。支持競爭情報的報表的生成和上報。F.一鍵結果上傳
一鍵或批量將所監測的信息第一時間轉載到自己的網站,自動提取正文和自動編寫摘要。G.一鍵導出
將信息導出到WORD文檔中,可供二次編輯或打印,自動編寫摘要,自動提取正文!H.信息加工
將信息導出到WORD文檔中,可供二次人工編輯,自動編寫摘要,自動提取正文!I.追加文檔
全國統一咨詢電話:400-656-0601
北京杰諾在線科技有限公司
3、添加監測頁
4、添加關鍵字
全國統一咨詢電話:400-656-0601
北京杰諾在線科技有限公司
5、監控文件導入導出,定時保存快捷操作
五、輿情加工
1、自動處理輿情:可自動分類、自動排重、自動編寫摘要,自動提取正文和提取關鍵詞等。能篩選出重要性強,急待處理輿情信息,過濾無用,過時,低影響力的信息。
(1)、右鍵常用操作功能
全國統一咨詢電話:400-656-0601
910111213
北京杰諾在線科技有限公司
(3)個性化定制和郵件訂閱:用戶可以根據要求,分類定制輿情信息,收藏重要的輿情信息,以及通過訂閱獲取輿情郵件自動送服務,實現個性化和及時便捷的輿情服務。
全國統一咨詢電話:400-656-0601
北京杰諾在線科技有限公司
3、分析網絡輿情傳播路徑,并能通過反向解析出url所對應的網站名稱。
4、一鍵轉載,輕松將標題,來源,正文,摘要等參數轉到自己的網站。
八、評估反饋
1、輿情反饋、批注、評論:
(1)反饋輿情需求:用戶可以提交輿情需求信息,成為改進輿情規劃的依據。
全國統一咨詢電話:400-656-0601
北京杰諾在線科技有限公司
(2)輿情批注和輿情評論:領導可以對輿情信息進行批注,一般用戶可以對輿情信息給予評論。批注和評論成為下一步改進輿情規劃的依據。
(3)統計匯總:支持對輿情信息瀏覽量、輿情加工工作量統計和輿情采集源有效性的統計。以文字和圖表的形式直觀的形成、生成各種網絡輿情趨勢圖表。利用這些統計數字和圖表可以有效地對輿情內容、采集源和輿情加工人員績效進行評估,推動輿情工作持續改進。
九、服務器要求
(1)CPU: P4 2.8以上
全國統一咨詢電話:400-656-0601