2010年1月アーカイブ

ひれ酒とか。

| コメント(0) | トラックバック(0)
有馬温泉。

今日「ブログのサイドバーを見直す(ランキング/表示順/高速化)」って記事を製品サイトブログに書いていて面倒だったので書いたのであげておきます(スタティック専用)。←しかしなんちゅう日本語だ。

特定のタグ(class指定可能)で囲まれた部分を実体参照に変換して出力するモディファイアescapecodeを提供します。

上記のようにテンプレートに記述すると、下記の部分をエスケープして出力します。

<pre><code class"mtml">
<$mt:EntryBody escapecode="code,mtml"$>
</code></pre>

This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.

御堂筋のイルミネーションも今週末まで。
MT5に移行したついでにモブログの設定してみた。

随分ご無沙汰してしまったのですが、本年も引き続きよろしくお願いします。

さて今年の最初は実用性があるかどうかはまったく別にして(且つ環境を選ぶものですけど)、サンプル的な感じで一つ。

きっかけは(ちょっと時間が経ってしまいましたが)、以下のエントリーから。

本文内の文章を言語解析してくれて、関連するエントリーを勝手に出してほしい

  1. MeCab/MeCab.pmをインストール
  2. MTのタグをMeCabの辞書に書き出して登録
  3. プラグインによってエントリーの保存時に形態素解析してタグを抽出して自動的にセットする

というものです。タグを辞書に登録するのだから素直にDB見に行ってやればいいってのとそういうのもどっかで公開されてるんですが、あくまでもサンプルとして作りました。「名詞,一般」で2文字以上であれば自動登録とかの方法でやってもいいと思いますが、タグっぽくならないはならないので(関連エントリーのためだけに使うのであればそれでもいいと思いますが大量のタグが保存されて重くなるという懸念もあります)、このあたりは工夫の余地があるでしょう。

辞書へのタグの追加は MeCab: 単語の追加方法 を参照いただくとして(テスト用途であればユーザー辞書として登録するのがいいかと思います)、インデックス・テンプレートに下記のように記述して辞書登録のCSVを作るための kanji2kana モディファイアも作りました。

<MTTags><MTTagName>,-1,-1,1,名詞,一般,*,*,*,*,<MTTagName>,<MTTagName kanji2kana="1">,<MTTagName>,Tags
</MTTags>

このインデックステンプレート(を再構築して生成されるcsv)を辞書に登録してエントリーを保存すると自動的にタグ付けされます。表記のゆれについては別途辞書に登録してやって吸収することが出来るでしょう。これに加えてogawaさんの TagSupplementalsプラグイン で関連するエントリーを出すようにすれば「本文内の文章を言語解析してくれて、関連するエントリーを勝手に出してほしい」ってのに近い環境が構築されないでしょうか?

※備忘録的にローカルMacの辞書登録コマンドをメモ

sudo /opt/local/libexec/mecab/mecab-dict-index -d /opt/local/lib/mecab/dic/ipadic-utf8 -u user.dic -f utf8 -t utf8 dict.csv

ということで(謎)今年も頑張って色々ネタとか提供していければと思いますのでよろしくお願いします。

Facebook

Twitter

このアーカイブについて

このページには、2010年1月に書かれたブログ記事が新しい順に公開されています。

前のアーカイブは2009年11月です。

次のアーカイブは2010年2月です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

Powered by Movable Type 6.2.6