EstraierによるRSS Feed検索
Estraierを使ってのRSS検索ページをつくってみた。
ページはこちら
研究段階なのでいきなりインデックスが初期化されたりします。
昨日からうごかして、すでに13万件のitemが収集されている。
どこまでいけるのかしら。
追記:20:09
さっそくindexをすべて削除してデータ収集やりなおし。
「content:encoded」を取るのをやめた。
コメント
はじめまして。
突然のカキコをお許しください。
私もEestraierをインストールしてwgetしたhtmlファイルを検索->タイトル表示、オリジナルのサイトへのリンク
はうまくいくのですが、取得したrdfファイルを検索
してタイトルとリンクをうまく表示させる方法が良く
わかりませんので宜しければご教授お願い致します。
それから(xxxpt.)とか表示させない方法も
教えて頂ければ幸いです。
投稿者: 岩崎 | 2005年05月27日 11:10
> 取得したrdfファイルを検索してタイトルとリンクをうまく表示させる方法
Perlのプログラムを使って、RSSから記事ごとにバラバラにして、HTMLファイルを生成しています。
あとは、estsearch.cgiのソースコードをゴリゴリいじって出力するHTMLを変えています。
投稿者: かぜぶろ | 2005年06月01日 16:11
かぜぶろさん、お答えありがとうございました。
やはりrdfを解析しないとだめなようですね。
ちなみにestsearch.cgiってバイナリなのですが、
ソースファイルもあるのですか?
投稿者: 岩崎 | 2005年06月01日 19:24
estraierの中のソースコードのestsearch.cを直接いじってコンパイルし直します。
C言語ですが、いじるところはHTMLだけなので簡単にできますよ。
投稿者: かぜぶろ | 2005年06月06日 00:10
すばらしい!!、なんかキモの部分を教えてもらった
ようですね、さっそくやってみます。
ありがとうございました。
投稿者: 岩崎 | 2005年06月11日 14:15