這是一個獨立的可執行的程序,完全免費,基于ACCESS數據庫,目前支持Z-Blog系統,其實支持其他ASP的Blog修改也很簡單,有需要的可以聯系一下我。(注:其他Blog程序的使用方法:先建立一個Access文件,然后建立一個表,表名為blog_Article,表中增加字段log_ID和log_Title,log_ID為自動編號,log_Title為文章標題,然后將你Blog上的文章標題都復制過來,一篇文章對應一條記錄,只復制標題即可,然后在本程序中選擇這個數據庫)
數據挖掘我是直接通過調用搜索引擎來實現的。原先打算使用Java下調用Google SOAP API來實現,不過不知什么原因,Google SOAP API搜索英文沒有任何問題,一搜索中文就報數組超界,不知道什么原因。只好去調用百度的搜索引擎。
百度的搜索引擎沒有API,不過我還是有辦法間接調用的。調用的時候發現中文的確沒有什么問題,也沒有錯誤,很順利就調通了程序。
我目前搜索的時候,采用了“實質傷害”這個概念,因為目前文章轉載的情況會非常多,每一個都去處理會很麻煩。因此我們只去尋找情況惡劣的即可。這個可以通過搜索引擎排名來實現。只尋找那些轉載地址對于原文影響最壞的。
這個程序使用起來很簡單,先選擇數據庫文件,再選擇Z-Blog系統,然后填寫你自己的域名,點搜索即可開始執行。搜索完成后會自動生成一個名為list.txt的文件,就是搜索結果。此程序對于部分標題的文章會有誤判,最好文章標題個性化濃一些。軟件的界面看起來不是很好,因為我沒有美工嘛。
點擊下載軟件:轉載文章搜索器
新聞熱點
疑難解答