テキスト版とXHTML版

青空文庫のテキスト版は、 JIS X 0208で規定された文字を使って、Shift_JISで作っています。改行コードは、CR+LFです。

テキスト版には、作品本体に加えて、「青空文庫収録ファイルへの記載事項」で説明している、前付けと後付けを加えています。レイアウトやルビ、傍点、傍線等を記述する注記の書式は、サイドメニューの「注記一覧」で確認してください。

入力ファイルを「テキスト版」に仕上げるために」からは、作り方に関する基本的な情報が得られます。

一から順を追って作り方を説明した「青空文庫工作員マニュアル」がありますが、ここには、変更した、古い規定を残しているので、注意してください。(工作員マニュアルの古い記述は、追って削除して行きます。)

 

テキスト版のイメージをつかむには、公開されているファイルを開いてみるのが早道です。ここからは、夏目漱石「『それから』予告」の図書カードにリンクしておきます。「テキストファイル(ルビあり)」のファイル名をクリックして、ダウンロードしてみてください。(現行の作業方針を示す「注記一覧」は、2010年5月1日以降の公開分から、適用します。それ以前に公開したファイルには、古い書式が残っている可能性があります。)

 

青空文庫では、まずテキスト版を作り、これをプログラムでXHTMLに変換しています。

サイドメニューの「変換してみる」から、このプログラムを動かせます。

自分のPCで変換」では、プログラムをダウンロードして使う手順を説明しています。