由于互聯網產生的信息泛濫,研究人員很難快速評估一個事件的真實情況。本次項目即為了解決以上問題,為科研人員提供一個智庫平臺。
怎樣從海量的科技信息及其相關信息中掃描、識別、監測和追蹤科技主題的發展變化,怎樣高效獲取和有效組織這些信息,并從中發現科學技術的體系結構、領域之間的關系及其變化,是本項目的切入點,因此,構建科技發展前沿互聯網信息監測與分析平臺勢在必行。
項目客戶對象:?政府管理與決策者 、科研機構 、科研人員、智庫平臺等。
監測與分析平臺由網站信息抓取、文件管理 、本體管理、信息檢索、信息分析和用戶管理6部分組成。本項目建成后,將能夠為研究人員獲取和分析研究資料提供高效的工具,并逐步形成相關研究領域的知識庫、資料庫。本項目建成后,在研究過程的每一個環節上,都能提供有效的優化工具,如下所示:
(一)擴大信息獲取的覆蓋面;
(二)海量信息的自動分類和關鍵元素提取;
(三)更精確地定位和查閱有效信息。
在課題研究階段,本項目實現多維分析、傾向性分析、熱點分析、趨勢分析等功能,能夠有效輔助研究人員從大量的信息和文獻中進行分析,提煉出有助于研究工作的素材。
在形成研究成果階段,信息系統能夠根據預置模板,生成相關分析報表、分析報告和原始資料,并支持導出成為Word等格式,更便于研究人員編制研究成果。
信息獲取的方式監測與分析平臺提供了網站信息自動抓取和用戶收集信息上傳這兩種信息獲取的方式。網站信息自動抓取,主要抓取公開發布于互聯網的信息。為使信息能最大程度的自動化處理,需要構建網站解析庫,保存網站中不同網頁的信息,監測與分析平臺據此批量下載所選網站中需要下載的內容。
政府和機構網站
主要指國際、國內主要相關政府部門和國際組織的官方網站,國際知名智庫、大學和研究機構的網站,這些網站是有關國際問題的權威信息發布途徑。
學術期刊網站
包括境內外國際問題研究領域、具有較高影響力的各學術期刊網站,主要獲取最新研究主題和研究動向,了解最新學術發展情況。
新聞媒體網站
新聞媒體網站主要包括國際、國內主流新聞媒體網站,是獲取最新國際重大事件、相關事態發展最新情況的有效途徑。
除了上述網站,本項目還需要進一步采集相關領域專業數據庫,并實現和本市宣傳部門的數據共享。
相關領域數據庫
實現各主要大國、地區大國、以聯合國為首的重要國際組織、以二十國集團和金磚國家等為代表的重要多邊機制官方發布報告庫(中英法三語種)的信息采集抓取,整合上海外國語大學學術論文數據庫、中國知網、中國統計年鑒、海關統計年鑒、中國工業經濟統計年鑒、中國工業企業數據庫、中經網統計數據庫等專業數據庫的部分查詢功能。
據初步了解,各省市區部門正在建設互聯網內容安全監管和文化建設共享平臺(簡稱“共享平臺”),該平臺主要采集國內有關的中文輿情信息,并可提供共享。
海量非結構化文本信息經過處理后,形成了結構化或半結構化的數據,需要進行多維度的分析工作。系統應能夠提供各類基礎分析模型和自定義分析工具,主要分析模型包括:
監測與分析平臺通過高效獲取不同來源、不同格式的信息,運用本體技術對這些信息進行有效的組織,展現這些信息反映的科技領域知識概念的結構及其變化,同時運用文本聚類技術,深入挖掘科技主題及其相互關系,結合國家、時間等維度的變化,為分析科技發展的宏觀走勢,以及對科技、經濟和社會產生影響的科技發展前沿趨勢提供支撐。
?
相關閱讀:更多案例!
最全的中國開放數據(Open Data)及政府數據開放平臺匯總