CIC home
一連テキスト群のWeb公開技術
参考情報として、簡単にですが、ご紹介します。
むしぼしシステム
稼動システム
- みんちかりぶ 2001.11.11公開開始
- Web-CIC 電網書架 2003. 1. 1公開開始
ReS3 -- ReSearch Support System 2003. 9.16運用開始[研究室PCローカル環境] 大学院修了のため廃
- CMS (content management system) 簡易html化ドキュメント群 2003. 9.20公開開始
ReS3@Home -- 2004. 3.25運用開始[自宅PCローカル環境] 現在使用せず
特徴的な機能
システム構成
標準で、自作プログラム「虫干。」(FORTRAN77で記述)と、FuzzyさんのDirList(フリーソフト)、その他からなります。
▲ 「虫干。」起動画面 (現行Versionは 1.23 ではありません)
むしぼし・虫干。の名前の由来
「ハードディスクに眠っていたテキストを不特定多数が閲覧可能(光)なWebにさらす」ということと、女優・本上まなみさんの著作「ほんじょの虫干。」より。
開発経緯
本システムは、メルマガのバックナンバーをWeb公開する「みんちかりぶ」構築のために開発されました。
その動機は以下のとおりです。
- メルマガ中で過去記事の参照がしたい。
- 人力でのバックナンバーのWeb公開のわずらわしさから解放されたい。
実は、以前からメルマガバックナンバーのWeb公開はしておりました(こちら)。しかし、作業の面倒さから、更新が滞っていました。
- 一般のロボット型検索エンジンにバックナンバーを収集させたい。
これには大きく二つの理由があります。
- ひとつは、現在でいうSEO(Search Engine Optimization)に近いものです。ただSEOがそのページの自身の検索順位をあげることを目的としているのに対し、私は、訪問者が、検索エンジンから、公開した大量のバックナンバーのひとつにでも訪れ、さらにそこからメインのページに訪れること(さらにはメルマガを登録してくれること)を期待していました。
なお、メルマガ発行システム「まぐまぐ」では、自動的にWeb上にバックナンバーが公開されますが、これは自由度がなく、またロボット型検索エンジンに収集されないものです。
- もうひとつは、全文検索です。全文検索は、サイト訪問者への大きなサービスとなります。
一般検索エンジンをアーカイブの検索に利用するというのは、WarBirdsさんのこのページ群を拝見して思いついたものです。いまはGoogleを利用されていますが、当時はgooでした。
「まぐまぐ」は、メールマガジンバックナンバー全文検索サイト「りぶりぶ」wayback http://www.lib2.com/を試験公開したにはしたのですが、1999年末ごろより、バックナンバーの収集を停止していました。
注: 現在では自前の検索エンジンを使用しています。
そして、テキスト群をそれぞれ個別ページとし、また、それらをくまなく結ぶリストを作り、Webに公開するという概念がちらほらでてきたのが、2001年 8月です。
2001年10月上旬、構築にかかりました。当初は、フォルダの内容一覧のリストをhtml出力するフリーソフトを使い、リストとテキスト群のサーバーアップロードで、簡単にすませようと思い、YamazakiさんのFolder List Maker(当時は、Version 0.5) を試したりしました。
しかし、これでは、実現されない事柄もあります。それが心残りなので、一念発起、システム開発を戦略的に位置づけ、独自ソフトウェアの開発を行いました。
システムの意義
こちらをご覧ください。(「みんちかりぶ」は「むしぼし」システムによる第一番ページ群)
関連リンク
▲
© 2004-2008 TAKAGI-1