« XML::RAIのバグ | メイン | Cellプロセッサの概要発表 »

EstraierによるRSS Feed検索

Estraierを使ってのRSS検索ページをつくってみた。

ページはこちら

研究段階なのでいきなりインデックスが初期化されたりします。

昨日からうごかして、すでに13万件のitemが収集されている。
どこまでいけるのかしら。

追記:20:09
さっそくindexをすべて削除してデータ収集やりなおし。
「content:encoded」を取るのをやめた。

トラックバック

この一覧は、次のエントリーを参照しています: EstraierによるRSS Feed検索:

» jams/2004-12-02/pukiwiki と blog2 で検索してみた from PukiWiki/TrackBack 0.1
error: blog2で生成したページのみで有効です。 pukiwiki と blog2 で検索してみた † EstraierによるRSS Feed検索 Estraierを使ってのRSS検索ページをつくってみた。 ということなので、早速試してみました。 検索結果 いろいろパラメータをいじれるようなので、... [詳しくはこちら]

コメント

はじめまして。
突然のカキコをお許しください。
私もEestraierをインストールしてwgetしたhtmlファイルを検索->タイトル表示、オリジナルのサイトへのリンク
はうまくいくのですが、取得したrdfファイルを検索
してタイトルとリンクをうまく表示させる方法が良く
わかりませんので宜しければご教授お願い致します。
それから(xxxpt.)とか表示させない方法も
教えて頂ければ幸いです。

> 取得したrdfファイルを検索してタイトルとリンクをうまく表示させる方法
Perlのプログラムを使って、RSSから記事ごとにバラバラにして、HTMLファイルを生成しています。
あとは、estsearch.cgiのソースコードをゴリゴリいじって出力するHTMLを変えています。

かぜぶろさん、お答えありがとうございました。
やはりrdfを解析しないとだめなようですね。
ちなみにestsearch.cgiってバイナリなのですが、
ソースファイルもあるのですか?

estraierの中のソースコードのestsearch.cを直接いじってコンパイルし直します。
C言語ですが、いじるところはHTMLだけなので簡単にできますよ。

すばらしい!!、なんかキモの部分を教えてもらった
ようですね、さっそくやってみます。
ありがとうございました。

コメントを投稿