« 2004年06月 | メイン | 2004年08月 »

2004年07月30日

mixiを体験

会社の同僚に紹介してもらって、mixiに登録してみた。
出身大学のコミュニティをのぞくと知り合いらしき人がちらほら。
奥さんも招待してみようかしら。

mixiをgoogleで検索してみると、こんな記事が
ソーシャルネット「mixi」、儲からなくても続ける理由

ユーザーが増えれば、サーバなど設備の負担も重くなる。1日の総ページビューも200万以上。「サーバを1台増やしても数週間ですぐにパンパンになってしまう状況」(笠原社長)。
 人が増えればトラブルも増える。言葉の行き違いなどでユーザー同士にいさかいが起き、スタッフが仲裁に入ることもある。サービス内容も次々に拡充しており、開発担当者の手も割かれる。

SNSでもこういうのってあるのですねぇ。やはり。
うちのサービスのPOISでは、知らない人が入って来れない(ある意味つまらない)ので、ユーザ同士のトラブルはない。流行ってもないけど。

問題が少ないように、流行るものを作るのが理想。
でも、それは理想でしかないから、補完するサービスは必要だというのが今の考え。
っていうか、仕事しろ>>自分

2004年07月29日

Asa Festoon新譜「ナツハヨル」がでます。

Asa Festoonの新しいCD、ナツハヨルがでる。
早速予約をば。

ナツハヨル
powered by
amazlet
Asa festoon
インポート・ミュージック・サービス (2004/08/11)
売り上げランキング: 35,078
近日発売 予約可


Asa Festoonはかなりおすすめ。結婚式でもいっぱい使いました。
中でも、Home&AwaySUIRENはいい感じです。
Asa Festoonのページのdiscographyで試聴もできるのでぜひ。

2004年07月28日

机の下の惨状

今朝まで会社の机の下がすごいことに。
undertablenet.jpg
この写真の中に
自作Windowsマシン 1台
Power Mac G5 1台
牛丼パソコン(並) 1台 このサーバ
牛丼パソコン(大盛) 1台 トラブルあってメンテナンス中
スイッチングハブ 5台
臨時ブロードバンドルーター 1台
写ってないけど、UPSもあります。

今はデータセンターに持っていったので、
パソコン2台とHUB 3台、UPS 1台に落ち着いてます。

こんだけつなぐと火事が心配。

抹茶とカルピス

新しい飲み物発見
抹茶とカルピス
greenteacalpis.jpg
「爽やか仕立てカロリーオフ」らしい。

なんか微妙にスッとしませんか?これ。
抹茶でもカルピスでもない感じです。
次は、、、ないかなぁ

カルピスのページ

2004年07月27日

プラネテス大人買い

プラネテスのコミック、一巻から四巻まで大人買い。

そして2時間ぐらいで一気に読む。
僕は漫画を読むのが早い。んで何度も読む。

なかなかおもしろいです。やはりアニメよりこっちの方が落ち着く。
2週目はみるの忘れたし。

同じ宇宙開発の漫画のMOONLIGHT MILEの猿渡五郎と親父の名前が同じなのは偶然か?
あと、アニメのタナベよりこっちの方が趣味ですな。


プラネテス (1)
幸村 誠

MOONLIGHT MILEとあわせてどうぞ。
MOON LIGHT MILE 1 (1)
太田垣 康男

2004年07月26日

スチームボーイみてきた。5点中3点ぐらいでしょうか。

スチームボーイみてきた。
映画の途中で、雷の影響で瞬電があって、ひゅーーんって感じで映画とエアコンが止まってしまったというのはまぁ、仕方のないことだとして、映画の内容は、

5点中3点ぐらいでしょうか。
おすぎさん風に言うと、1200円ぐらいかなぁ。
30分アニメみたい。

シンプルな冒険活劇で楽しめるし、映像もなめらかなんだけど、それだけだったかな。
次回作を作るみたいなので、それとあわせて、5点いけるかな。

似た感想を持たれているもいました。

最近、見た映画と言えばイノセンスやアップルシード。
この2つもおとなしいと言えばおとなしい方なのだが、やはり、新しいことへの挑戦とか過激な表現があったと思う。
アニメの範囲で行けば、DVDでみた「ファインディング・ニモ」もピクサーならではで、おもしろかったし、水中を表現するというすごい試みも見えた。

やはり9年はかけすぎでは?
おいて行かれちゃったんじゃないかしら。。。大友さん

イノセンス スタンダード版

発売日 2004/09/15
売り上げランキング 3

おすすめ平均
押井守の最高傑作
「イノセンス」とは、何か。
押井作品なので

Amazonで詳しく見る B0000APYMZ

今日はトラブル続出

続くときは続く。
まず、事務所ゲートウェイに使っていたサーバが壊れた。例によって、HDDは富士通
ついでに、コンデンサの電解液の漏れも。
04-07-26_16-25.jpg
結構直しておられる方がいる。
どうするか、現在検討中

その次は、再びHUB固まる。
今日は別のに入れ替えました。
PlanexのFMX-24NW
このHUB、ステータスランプの光り方がやる気がないのが気に入りません。
まぁ、まともに動いてくれれば文句は言いませんが。

2004年07月22日

topコマンドでfloating point exceptionエラー

とあるサーバでtopコマンドをうつと、

  2:39pm  up 254 days, 22:42,  1 user,  load average: 0.02, 0.01, 0.00
90 processes: 89 sleeping, 1 running, 0 zombie, 0 stopped
CPU0 states: 66.0% user, 33.0% system,  0.0% nice,  0.0% idle
Floating point exception

と、なってしまって困った。すごく困ることもないけど。
ぐぐってみると、同じことがあるようだ。解決らしきもの

* It is common to having an uptime of at least 250 days.
* It is common to Dell SMP servers.
* It is not specific to kernel version (both 2.2 and 2.4 affected) or RedHat
distribution (7.0 and 7.1).
* It is not specific to RH-compiled kernels (one guy had custom compiled).
* When run under 'strace', it always works.
* A reboot clears the problem.

Dellではないけど、SMPマシンで、uptimeが254日。
次リブートができる機会まで我慢するか。

ヌルポに対抗してフロポっていうのは流行りませんかね。

POISのトップページ改編

マイ・グループタウン POISのトップページを改編しました。

などを追加して、「わかりにくい」ポイスを使うイメージが湧くように考えました。

ポイスガイドでは、「タウンって何?」っていうところも解説。バーチャルタウンの定義なんかも書いてみた。

バーチャルタウンとは、インターネット上であなたの部屋をもち、友達、家族、仲間と一緒に楽しくお話や、ゲームをしながら住むことができる、仮想の街です。

いろいろ考えたけど、こういう文章に落ち着いた。
ハピタンとかに当てはめても破綻しないと思われます。

いかがでしょうか。
ここを読まれた方、機会があれば登録して使ってみてください。よろしくお願いします。(宣伝)

2004年07月21日

BlogSurfデータを間違えて消した。

BlogSurf、10日間分ぐらいのデータを間違えて消した。
文字列の切り詰めのモジュールをいじって、文字化けを起こしてしまったので、その1時間ぐらいのデータを消そうとして、

delete from feeds where reg < unix_timestamp('2004-07-01 12:00:00');

あぁーーー。今日は1日なんかじゃねーよー。
データが消えたので、多少テーブル構造なんかもいじって、クロール再開

仕事のデータじゃなくてよかった。

2004年07月19日

ping.bloggers.jpなおった。pingサーバについて考えてみる

高山行っている間に直った模様。よかったよかった。
平田様おつかれさまです。

ping.bloggers.jp を復旧しました。気がつくのが遅れてしまいましたが、現在は順調に動いております。
原因は、自分のところの Movable Type 3 への移行作業中、ついでにとデータベースの設定をちょっと変更していたためでした。ごめんなさい...。

ということでした。

pingを飛ばすのがblogと言うわけではないけど、更新情報の公開共有のためにも、pingサーバってblogの発展に欠かすことができないと思います。
楽天のping送信が始まったときにもすこし話題になったけど、スマートなやり方 or 力業でも耐えられるやり方を考えないといけない時期に来ているのかもしれません。

協力できることないかしら。。
とpingサーバを運用することを考えてみる。

欲しい機能
・ping受信はどこからでも受ける
・ping.bloggers.jpにあるfilter付きのchanges.xmlを配信できるようにする
・RSS auto discoveryも行いたい
とシンプル目にする。重要なのはすべてのpingを受信し、フィルタ付きのchanges.xmlの配信

実現方法
・サーバは2台あればベスト、squidを「no_cache ALL」などで起動。クッションとしてのみ使用
・※mod_perlを入れたApacheでpingを受信、バックエンドのmysqlに渡す。
・※changes.xmlはユーザリクエストに応じて生成。
・RSS auto discoveryは適時動作で、記録

※のマークのところがどれくらいの負荷かが重要なところ。
サーバは回線と電源の整った場所におきたい。

問題は、お金になかなかなりにくい(サーバ代と回線代の捻出、上司の説得)ところと、
blogコミュニティに受け入れられるようになること。
ドメインがでることでの広告効果とか狙えればまだいいのだけど。

ping.bloggers.jpってほんとにいいサイトでいい仕組みだと思います。

さるぼぼ小判焼き〜高山行ってきた

結婚式後の近所の挨拶回りで奥さんの実家である高山行ってきた。

すでに何度か行っているのですが、駅まであたらしいおみやげ物発見
040718_1516~01.jpg
さるぼぼ小判焼き。
試食もできた。おいしいので帰りの電車用に1つ購入。

中身は
040718_1531~01.jpg
こんな感じ。
かわいい。

こういうのはどっちから食べるか迷う。

040718_1545~01.jpg

頭からがぶっ。
ちょっとシュール。奥さんに変な目で見られながら写真撮る。
一口で食べるのがよいでしょう。

おいしかったです。
次に行くときも買おうかな。

2004年07月16日

ping.bloggers.jpが止まってる。

今、ping.bloggers.jpが動いてない模様。
17:10ぐらいで更新が止まってます。
どうしたのだろう。

BlogSurfも更新がない。
ほかのpingサーバも見に行くようにしようかな。

王監督って優しい人だなぁ

王監督「渡辺さんがかわいそう」 セ5球団の反1リーグ制方針転換問題視

優しい人です。
ダイエーもしばしば身売りとか合併とかの話題がでるから、
大変だろうな。

Perlをexeファイルに変換。PAR

Perlしか使えないので、かなり気になる記事。メモメモ

NDO::Weblogさんのところ経由、いやな日記さんの記事をさらに読んで、ラクダのステーキさんの記事

PerlでGUI

perlでGUIプログラミングをする方法について、定番のTkではなくWin32::GUIを使ったもの、でかつバイナリ配布ができるように、ということでいくつかの方法を検討した。

煮詰まって来た感が強くなったころ、PAR(JavaのJARみたいなもの)というものの存在を知り、これでもEXE形式が生成できるとのことなので、これで試してみる。ppmで適当にPARに必要そうなものをインストールし、ppコマンドで上記のGUI Loftのデモ用プログラムをコンパイルしたところ、うまくできた。とりあえず[GUI Loft]+[PAR]の組み合わせで方針を決めてみる。


PARを使うとGUIまでうまく動かせるらしい。
いやな日記さんによると、開発も活発らしい。フリーなのもOK
バイナリファイルが大きくなるのが難点か。

アップローダーとか作れるかなぁ。

2004年07月15日

ping.bloggers.jpにでてこない

ping.bloggers.jpにでてこない。changes.xmlにはいらない。
どうしてだろう。。

BlogSurfはping.bloggers.jpからしかデータを取得しないので自分のブログが検索されない

_| ̄|○

どなたか考えられそうなこと、教えてください。

ChaSenにSKK辞書を追加

人名だけだけど、ChaSenの辞書にSKKの辞書を追加してみた。

ここから辞書をとってきて、

(品詞 (名詞 固有名詞 人名 *)) ((見出し語 (みだし 3200〜3500)) (読み よみ))

にて追加しています。

パースに使ったプログラムはここ
スクリプの作りは適当です。

# cat SKK辞書ファイル | perl skk-jinmei2chasen.pl > jinmei.dic
# makeda jinmei jinmei.dic


とすれば、辞書のファイルができあがります。
詳しくは、ChaSenまたはipadicのマニュアルをみてください。

Jcode.pmのバグ?Text::Iconvを使う

BlogSurfを作りながら気づいて悩んだのだが、
Perl5.6でJcode.pmのUTF-8の扱いにバグ?があるようだ。

my $text="適当な文字列";
my $utf8=Jcode->new($text)->utf8;
my $euc = Jcode->new($utf8)->euc;
print getcode($euc);

の結果がutf8となってしまうことがあった。

BlogSurfでは、取得してきたRSSをUTF-8にして、XML::RSSモジュールへ渡して、
データベースやchasenへ渡すときはeucにするということをしています。
eucに変換できないとすべてがおかしくなっていくので困ります。

なので、CPANを探してみつかったText::Iconvを導入して

my %codehash=(
	ascii=>"ascii",
	binary=>"",
	euc=>"euc-jp",
	sjis=>"Shift_JIS",
	jis=>"ISO-2022-JP",
	ucs2=>"UCS-2",
	utf8=>"UTF-8"
);
my $iconv = Text::Iconv->new($codehash{getcode($str)},'変換したいcode');
my $newstr = $iconv->convert($str);


BlogSurfの文字化けはこれで解消しました。
よかったよかった。

Blog記事検索をつくってみた。

勉強と興味を兼ねてBlog記事を検索できるページを作ってみました。
BlogSuf マウスでブログを詠むサイト
です。

検索結果ページや記事の詳細情報のページに「関連する(かも)キーワード」や「関連ありそうな記事」を表示し、それらをマウスでぽちぽち押していきながら、記事をたどっていったら、「にやり」と笑ってしまうキーワードの関連や、思ってもみないページがでてきて楽しい、と思われます。
Bulkfeedsの真似みたいなところも多々あります。

Blogの更新情報にはping.bloggers.jpからchanges.xmlを取得しています。
取得したRSSはchasenを用いて分かち書きし、packしてMySQLに突っ込んでいます。
全文検索は、MySQLのFullTextSearchを使ってます。

あと、Blog Surf Feature Wordという名前で、最近の特徴語をまとめてます。
役に立つデータになるかどうか、まだ調整中なのですがRSSも作ってます。

もしよろしければお使いください。

2004年07月14日

プラネテスがNHK教育でやる!

プラネテスがNHK教育でやるんだ。

NHKのサイト

7月15日(木)<14日深夜>  第1話  「大気の外で」


今日からじゃん!!
ビデオつなげて撮るか、見るかしないと。
漫画を買うかどうかすごく迷っているんです。

DVDレコーダーがすこし欲しくなってきた。

Google AdSenseをつけてみた。

昨日、Googleから審査終了のメールが来てたので、さっそく導入してみました。
いろいろ研究してみよう。

現在の設定は

google_ad_width = 728;
google_ad_height = 90;
google_ad_format = "728x90_as";
google_color_border = "dde3ba";
google_color_bg = "dde3ba";
google_color_link = "669966";
google_color_url = "669966";
google_color_text = "333333";

と、言う感じで色はページの背景と同じものを設定。
高さ「google_ad_height」ってすこし大きいような気もする。空白が大きい。

ビッグバナー (728 x 90)とバナー (468 x 60)の真ん中が欲しいです。600pxぐらいの大きさで、広告3つ表示だとぴったりじゃないかなぁ。
リナザウだと。横幅が600pxぐらいが限界なんです。

2004年07月08日

MeCabを追加

MeCabを形態素解析の比較に追加しました。
これでChasen、Kakasi、MeCabの3つでの比較ができます。
ついでにページタイトルに「わかち書き」をいれました。この方が正しいですね。

ChasenとKakasiとMeCabの形態素解析・わかち書きの比較
お試しください。

MeCabは速度が揺れます。1度表示をしてから再び送信すると速度が速くなったりします。速度的にはChasenよりほんの少し早いです。Chasenがバージョン2.3.0で導入したダブル配列ライブラリ「Darts」のによるところだと思われます。

2003年7月現在, Darts は, MeCab, ChaSen に採用されています. Darts は, MeCab で使 われている Double-Array のコードを 改めてパッケージングしたものと 考えていただいて構いません.


ということなので。
速度の揺れがなくなってより安定して新しいipdicが使えれば使うかな。

MeCabの導入メモ
ここから「mecab-0.78.tar.gz」をダウンロード
「ipadic-2.5.1.tar.gz 」も必要なのでここからダウンロード

$ tar zxf mecab-0.78.tar.gz
$ cd mecab-0.78
$ cd dic
$ ここにipdicをコピー
$ tar zxf ipadic-2.5.1.tar.gz
$ cd ..
$ ./configure --prefix=/usr
$ make
$ make install


Perlのモジュールは
ここから「mecab-perl-0.78.tar.gz」をゲット
普通のPerlモジュールとしていれることができます。-lstdc++がないとか言うけど無視しても大丈夫。

わかちがきに利用するには

use MeCab;
my $mecab = MeCab::Tagger->new(["0"]);
my @m_ret = map {{val=>(split(/?t/,$_))[0]}} grep {$_ ne "EOS"} split(/?n/,$mecab->parse($text));


とでも書きます。 -O wakati だとエラーがでて動きませんでした。

2004年07月06日

ChasenとKakasiの形態素解析の比較

Chasenネタがつづくけど。
一つ前のは、これを作っていたときのメモだということで。

ChasenとKakasiの形態素解析の比較

Chasen(2.3.3)とKakasi(2.3.4)の形態素解析の結果を比較できます。Chasenは前回の記事に書いてある設定をしてあります。処理の比較等はMeCabのページ等に載っています。


一般的に言われている通り、Chasenの方が処理が細かいです。
Kakasiは名詞はきちんと分割されているように思えますが、助詞、動詞、ひらがながつづくところはだめみたいです。ただしい文章はただしく解析されるけど、普段の言葉遣いだときついですね。

処理はKakasiの方が軽いと言われているのでこの結論面白くないけど、一長一短、適材適所だと思われ。
MeCabも試そうっと。

Chasen 英数字が混在する文字列の扱い

Chasenで英数字が混在する場合、英数字がすべてばらばらで「記号-アルファベット」になってしまうので、これを変更。「名詞-一般」となるようにしました。

/usr/etc/chasenrc

(COMPOSIT_POS ((名詞 一般) (名詞 数) (記号 アルファベット) (記号 一般)))


を追加。

Chasen-users MLのここからのスレッドを参考にしました。感謝です。

2004年07月05日

Google AdSenseに申し込んでみた

Google AdSenseに申し込んでみた。

お客様にお申し込みいただいた内容は現在審査中であるため、このログイン情報を持つ AdSense アカウントは存在しません。審査はお申し込み日から 1 週間以内に終了し、結果は電子メールでお知らせします。AdSense への参加が承認されましたら、現在のアカウントでログインしてプログラムをご利用いただけるようになります。

どれくらいかかるのかなぁ。
ちょっと楽しみ。

2004年07月01日

HTTP::Proxyの使い方

HTTP::Proxyは、

This module implements a HTTP proxy, using a HTTP::Daemon to accept client connections, and a LWP::UserAgent to ask for the requested pages.
The most interesting feature of this proxy object is its hability to filter the HTTP requests and responses through user-defined filters.

なPerlモジュールです。

んで、このfilterなのですが、リモートからの返答が「Transfer-Encoding:chunked」で帰ってきた場合(基本はこちらみたい)、フィルターにもコンテンツがバラバラで渡されてしまい、困る場合があります。
そのときは、HTTP::Proxy::BodyFilter::linesを使います。

use HTTP::Proxy;
use HTTP::Proxy::BodyFilter::lines;
$proxy->push_filter(
	response =>HTTP::Proxy::BodyFilter::lines->new("EOF"),
	response=>MyFilter->new,
	mime=>"text/html"
);
$proxy->start;

package MyFilter;
use base qw(HTTP::Proxy::BodyFilter);
sub filter{
	my ( $self, $dataref, $message, $protocol, $buffer ) = @_;
	unless($buffer){
		my $html=$$dataref;#これでHTMLをget
		$html =~ s/perl/PERL/gi;
		$$dataref=$html;
	}
}
1;


一応きちんと動いた。
これで、きちんとHTMLを読み込んでからごにょごにょと処理できます。

出口調査では「民主党」

僕が某掲示板に影響されているのか、本当に偏っているのかわかりませんが、最近TBSとテレ朝の報道に偏りが見えて仕方がなかったりする。
まぁ、うちでは朝晩すべてNHKで、受信料もきちんと払っているぐらいなので、他のチャンネルは実は、あまり見てなかったりもするので、某掲示板の影響説が強いですけど。

んで、molmol3のBlog事始めさんのところで
こんなコピペ発見

==============================
     出口調査は「民主党」!
 出口調査では「民主党」に清き一票を!!
\\                     //
       ∧_∧ ∧_∧
      ∩´∀` )( ・∀・)  アナタの一票が
      ヽ    .)( つ¶ 9    開票速報を変えます!
      | ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄|
      |. ジャス研  新  党 .|
      |________|  /
      .||. ∧_∧  ∧∧  ||   出口調査は「民主党」!
      .|| ( ´∀` ) ( ゚Д゚) ||     出口調査は「民主党」!
      ||-────────|| どこに投票しても出口調査は「民主党」!
      || _______ .||   出口調査で「民主党」に清き一票を!!
     .||__       __|| \     
     .|〇〇|≡≡@≡≡.|〇〇|
     .{二二二._[  ]_.二二二}
      凵            凵
◇◇◇◇◇◇自民でも民主でもなく「マスコミにNO!」◇◇◇◇◇◇
◇◇◇「出口調査は民主党に清き一票を」キャンペーン開催中!◇◇◇
http://www.wafu.ne.jp/~gori/diary3/000306.html
=======↑↑↑ コピペ推奨 ↑↑↑============

機会があればやってみたいと思います。
「マスコミにNO」などということは、あまり言いませんが、湘南ゴミ拾いオフのような楽しみとして。
選挙は、真剣に、楽しんで、清き一票をいれてきます。