実は僕が思っているより……

先日書いた『5つの書体』の件だけど、僕はどうしても不思議に思えて仕方ない。「(OTF パッケージの基本5書体のような)基本的な書体をフリーフォントで確保しよう」という話が、どうして今に至るまで出てこなかったのか、ということが、である。

過去の TeX Wiki のアーカイブとか、TeX / LaTeX 関連でアクティブな人々の公開しているコンテンツなどをちらちら見ていると、こと日本語のフォントに関する話は、Microsoft Windows、それも Office 等にバンドルされている HG フォント込みでないと成立しない話が多過ぎる。いや、僕も手元に Microsoft Office の入った Windows があるけれど、しかし HG フォントなんて正直言って使ったことがない。どうして世間ではこうも皆 HG フォントに familiar なんだろう、と奇妙に思われてならない。

これが、PDF の登場以前だったら、あまり問題になることはなかったのかもしれない。ビットマップ展開された PS ファイルや、それが印刷された紙媒体というかたちで日本語の文書がやりとりされるのならば、フォントの問題に関してあまり頭を痛める必要はなかったろう。しかし、PDF が登場し、フォントが埋め込まれることが多くなってきたこの何年かの間ですら、フリーフォントの確保という問題に関して、皆アクティブに声を上げようとしなかったのは、これは実に不思議なことである。

日本語におけるフリーフォントとして、もはや拠り所とも言えるような存在である IPA フォントにしたって、これはもともとフォント単体でそのように活用されることを企図したものではない。IPA が、たまたま自分のところで成果物として公開するアプリケーション用に確保したフォントがあって、これ欲しさにソフトをダウンロードする人が増え(IPA フォントは当初、フォント単体での配布が行われていなかったためにこんなことになった)、やがてフォント単体の配布とライセンスの整備が行われて、今や IPA はフリーフォントのパイオニアみたいな風情だけど、元々 IPA も、そしてその周囲の人々も、そんなことを望んでこういう状況に至ったわけではないのだ。これは、たまたま、実に幸運なことにそうなったのだ、というだけのことである。

いや、僕は、別に杓子定規な法の適用をよしとするわけではない。しかし、社会の中で我々が、大きな資本力、政治力を持つ存在に言論の自由を脅かされないためには、我々がものを書き、配布するにあたって、そのフォントは不正使用だ、などという茶々を入れさせる隙のない手段を持っているべきだ、と思うのだ。フリーなフォントは、確実にそういう手段の一部として求められるべきものなのだ。

ある日、警察や弁護士がしれっとした顔でやってきて、「オタクが公開されてるあの文書、フォントの不正使用の疑いがあるんですよねえ」と言われる。いやこの程度で逮捕されるようなものではないでしょう……しかし、しつこくつきまとい、周囲には聞き込みと共に「不正使用の疑いのある輩」という風説を流布される。こういうことを聞いた人は、あの人がそういうことをするわけがない、とは思ってくれない。こんなこと言われてて、それが 100 % その通りではないかもしれないけれど、でも 1 % 位は何か悪いことがあるんじゃないのぉ? と思いがちなものだ。そしてそれと風説が相俟って、あなたは色眼鏡で見られるようになる……そんなことの起きないという保証がどこにあるのだろうか。低次元な話だと思われるかもしれないけれど、言論の自由というのは、こういう次元で辛くも守られるような危うさがあるということを、我々は忘れてはならないのだ。

そんなこともあるので、僕は自分が必要に応じてフリーなフォントが使えるような体制を整えようと思ってきたし、これからもそう思い続けることだろう。これを書いているバックでは、今 FontForge が動いている。私用のフォントを生成中なのだ。普段は専らヒラギノフォントを使っている僕だけれど、ほとんど使わないものでもこういう事情で整備をしているのである。まあ、過敏だと思われる方が大半なのだろうけれど、僕にはこれが過敏だとは思えないのだ。

Linux-3.5-rc1

手元の環境のリフレッシュ作業が終わったところで、kernel を 3.5-rc1 にしようと build して reboot したら、ネットワークに接続できない。何? どういうこと? 慌てて前の 3.3.7 で reboot すると、何も問題ない。僕は未だに有線 LAN を使用しているので、メカニカルトラブルじゃないか、と思って焦ったわけだけど、どうも kernel に起因するものらしい。

configuration を精査して、再度 build してみたけれど、状況は変わらない……それらしい話も聞かないし、今日の午後にでもちゃんと調査してみることにしよう。

スウェーデンは遠い

スウェーデンには一度だけ行ったことがある。それも2時間だけ。

ある国際会議がフィンランドで開催されたのに参加したのだが、この国際会議が、一日目と二日目がヘルシンキ工科大、三日目と四日目が、ヘルシンキとストックホルムを結ぶ船上、つまりバルト海上で行われたのだ(なんでも、その船上で会議をするのが北欧では流行っているとか何とか、そんな話だったが)。で、セッションの合間にストックホルムで2時間だけ時間ができて、上陸したのだった。

正直言うと、ストックホルムの印象はあまりいいものではなかった。カフェの店員に間違えてフィンランドの札(嗚呼、あの頃はぎりぎりユーロ前だったのだ)を出したら、うんざりしたような顔で "This is not Swedish money." という言葉と共に投げ返されたりしたせいかもしれない。天気はまさに霧咽ぶ中、という感じで、でもあの店員の応対が良かったら、この印象は全然違ったものになっていたのかもしれない。

しかし、スウェーデンはオンラインでは結構縁のある場所だった。僕が熱力学計算に使っていたあるデータベースが、スウェーデン王立アカデミーにサーバーがあったり、他にもいくつかのソフトでスウェーデンにはお世話になった。当時(いや、そんな大昔じゃないんだけど)も、ネットワークはそんなに重く感じなかった記憶があるのだが……

実は、今丁度、Debian GNU/Linux の sid(いわゆる不安定版……僕はこれを常用している)のインストーラーをダウンロードしているのだが、これの最新版(いわゆる daily-build image)が、1か所のサーバでしか供給されていない。しかもそのサーバがあるのはスウェーデンらしい……いや、それはそれで全然構わないのだが、このサーバの回線がとにかく細いのだ。数十 MB のファイルを落とすのに数十分かかる……毎分 1 MB って、今時そんな回線なんてあるのだろうか? 個人で xDSL(いや、今メタルの回線で xDSL を使っている方はかなり少ないと思うけれど)で接続していたって、こんなに遅くはないだろうに……しかもスウェーデンって言ったら、フィンランドと並んで、北欧の IT 先進国なんじゃないの? どうしてこんなに細いのか。

ftp や http だから遅いのか、と思って、BitTorrent や jigdo を試してみたけれど、一向にダウンロードできない(だから供給がここ1か所だけだ、と言えるわけだが)。今は ftp で落としているのだが、これは本当になんとかならないものだろうか…… Ubuntu ユーザが増えたと言っても、あの老舗にしてカタいことで著名な Debian なんだから。まあ、でも、とにかく今は待つしか術がないのだった。

5つの書体?

某氏からメールでご質問いただいたので、改めて書いておくことにする。

日本語のフォントを選ぶ際に、何が「標準的に用いられるセット」なのか? という問題は、実のところ、これが答です、というものが確立しているとは言い難い状態なのかもしれない。たとえば欧米の場合(少なくとも TeX / LaTeX の世界では)、まず:

  • Serif (roman)
  • Sans Serif
  • Typewriter Type
の種別があって、これを font family という。次いで:
  • Medium(標準の太さ)
  • Bold(いわゆる太字)
という種別があって、これを font series もしくは font weight という。そして、
  • Upright(標準の書体)
  • Italic(いわゆるイタリック、イタリア風デザインの斜体)
  • Slanted(Upright をそのまま斜体にしたもの)
  • Small Caps(小文字が小さな大文字で表わされる書体)
という種別があって、これを font shape という。

ではどういう風に字体が決まるのか、というと、まずあるフォント……ここでは Palatino を例とする……を選ぶ。Palatino は Serif のフォントなので、このフォントを選ぶということは、Serif に Palatino を割り当てる、ということになる。そして、この Serif のフォントとして選ばれた Palatino には Medium と Bold、2つの series があって、それらには各々4つの shape がある。だから、あるフォントを選択する、ということは、ある family にそのフォントを割り当て、それに対応する合計8種のバリエーションが規定される、ということになる。

そして、個々の字体を表す際には、これらの情報がその名前に包含されていることが望ましいわけだが、これは Karl Berry によって命名規則参考:日本語による解説)として体系化されている(正直、これを使いこなすようにはなれそうにないけれど)。

では、日本語の場合はどうなのか……これが、実のところ、どうもいい加減なのである。旧来の TeX / LaTeX では、まずフォントは「明朝」「ゴシック」の2 family のいずれかに割り当てられ、その下に Medium もしくは regular と Bold の 2 series がある。その下に shape も指定できるのだが、基本的に shape は1種類しか使わない。まあここまではいいのだが、旧来の日本語 LaTeX では \gt (ゴシック) と \bf(ボールド) は混同してもかまわない、ということになっていた。通常の記述と強調部とが表現できればいいんだし、こうしておけば、欧米文字の部分で bold で強調した部分が日本語でも強調されていいよね! という発想だったんだろうけれど、これはよくよく考えると、family と series が混同される「仕様」だったわけだ。じゃあなぜ \gt なんてものがあんねんな? と、TeX / LaTeX を使い始めた頃は不思議に思っていたのだが、要するに、日本語のフォントに関する初期の扱いはこの程度だった、ということなのだろう。

複数種のフォントの扱いが不可欠な出版の現場において、たとえば旧アスキーで日本語フォントがどのように扱われていたのか、ということに関しては、残念ながら僕は知らないし、そういうことが文書化されたものの存在も知らない。ひょっとしたら、『日本語LATEX2eブック』(中野 賢 著、アスキー、1996)などにそういう記述があるのかもしれないが、残念ながら今手元にない(古書で買おうかなあ)。ただひとつだけ言えるのは、UTF 改め OTF パッケージが使われるようになってから、「混同する仕様」が(僕からすると何の前触れもなかったように思えるのだが)さくっと変更されている、ということだ。

この件に関して、実はあまりいい感情を抱いていないことがある。それは、OTF パッケージと uptex / uplatex による多書体化というものが、いわゆる CJK 拡張と常に寄り添うようなかたちで進展してきたことである。いや、多書体化というものが、日本と同じく縦書きと横書きをする CJK 圏内に等しく恩恵を与え得る拡張であることは理解できるし、そのことがユーザ数の確保につながり、それが長期的・安定的なアプリケーションの存在位置の確保、そして将来の進展につながる、という効用も理解できる。しかし、さー日本語使いましょ、という人がいきなり、ハングルや簡体字、繁体字の、聞いたこともないようなフォントが列挙されたフォントマップと格闘しなければならない、というこの状況って、ちょっとおかしいんじゃありませんかねえ?

僕の場合のことを恥ずかしながら書くと、このフォントマップを見たことで、僕が OTF パッケージや uptex / uplatex を使い始めるのに若干の期間を要したのは事実である。で、ええい俺はそんなもの使わないんだ、日本語に関わらんものは全部消してしまえ! とやり始め、それをするにはどれが中国語のフォント、あるいは朝鮮語のフォントなのか分からなければならないということに気付いて、あ゛あ゛あ゛! と苛立ちながらも消していった結果、何となく分かったのは、たとえば OTF パッケージのフォントマップの場合、

(フォントメトリック)(文字コード)(family)(series)(縦横)
となるように個々の字体が記述され、それに対して対応させるフォントを assign するようになっている、らしい……ということだった。しかし、これでは、実際に文章を書くときのフォント指定との間の関係が非常に掴みにくいし、そもそもどれだけの数のフォントを用意すればよいのかも分かりにくい。

いや、「他に何かいい方法あるなら書けやヴォケェ」とか怒られそうだけど、実際に僕もあまり良い方法を思いつかない。ただし、一エンドユーザとしては、こういう記述のひとつひとつよりも、実際に使う字体の数がどれだけで、それと何を対応させてフォントマップを書けば、実際に組版するときにそれらが「使える」のか、という方が遥かに重要だ、ということだけは、確信をもって言える。

では、僕が自分の頭の中でどういう風にそれを認識しているのか、というと、

  • 基本的に字体は「明朝」と「ゴシック」に大別される。
  • 各々の字体には「標準」「太字」があり、これに加えて「丸字」「細字」「極太字」が指定できる。
……という、甚だいい加減な認識になっているわけだ。しかし、これをあてはめると、たとえば、
  • rml → 明朝標準
  • gbm→ゴシック標準
  • hminb→明朝ボールド
  • hgothb→ゴシックボールド
  • hgotheb→ゴシック極太
  • hmgothr→ゴシック丸字
  • hminl→ 明朝細字
と言いたいんだなあ……という位は理解できる。あとはこれらやそのバリエーションに対して、対応するフォントを assign して、必要な場合は CID と Unicode の仲立ちをする /AJ16 オプションや、TrueType Collection 内の n 番目のフォントを指定するための ":<n>:" を明示的に追記すればいい……という話になるわけだ。恥を忍んで書くけれど、この整理を付けるのに、確か半日位を要したのではないかと思う。こんなこと当たり前じゃーん、と、フォントマップに習熟した人々は言うのだろうけれど、このような解釈ができなければ、そしてこのような指針が示されていなければ、世間の人々が TeX / LaTeX でお望みのフォントで……というのは、いつまで経っても無理なことだろう。

いや、僕が危惧しているのは、むしろ「余計なことはせずにこちらの御仕着せに黙って従っておけばいいんだ」というようなことを言う人が、日本の TeX のコミュニティに存在する(まあどこでもそういう人の一人位はいるものだろうけれどね)、ということである。かつて僕も、いかに ls-R データベースが有害か、というのを、W32TeX を普段使っているらしい人にきつくきつく御忠告いただいたことがあるのだけど、いやー、tetex や TeX Live を Linux や Mac OS X 上で使っていて、Windows 上での TeX / LaTeX 事情の方も少しは分かる僕としては、そんな議論は何の意味も持たなかった。はぁ。W32TeX では ls-R データベースは不要なのかもしれないけれど、TeX Live の場合はちゃんと生成しておかないとどうにもならないんだけど……しかし、何故 W32TeX が世界を全て覆っているかのような、こういう姿勢になってしまうのだろうか?(いや、W32TeX に関わるほとんどの人達はそんなこと言いやしないんだが) あーこの人はいわゆるタコにアホな質問をされ続けて、律儀に(愚直に?)もそれに答え続けているうちに「馬鹿は黙って俺らの整備したシステム使っとけや」的な境地に至ってしまったのかしらん……と、邪推すらしてしまったのだった。

こういう手合いに出る頭を叩かれ続けた人が、そのうち「TeX Live ではとりあえず黙って IPA フォント使っとかないと何言われるか分からないよー」とか言い出しかねない。これは誰にとっても何の益もない話である。誤解されると困るのではっきり書くけれど、僕は、システムが complicate になることが悪いと言っているのではない。complicate であるなりに、タコでも少々根気があれば手繰れる「蜘蛛の糸」を垂らしておいてあげるような配慮が、少しはされてもいいのではないか、と言っているのだ。

だから、僕は『TeX Live を使おう──Linux ユーザと Mac OS X ユーザのために──』の中では、誤解を恐れずに、日本語の字体の基本は、

  • 明朝
  • ゴシック
  • 太明朝(明朝ボールド)
  • 太ゴシック(ゴシックボールド)
  • 丸ゴシック(ゴシック丸字)
の5つですよ、それに対応するフォントはこれですよ……というような書き方をしている。『美文書作成入門』で \ebseries に関する記述があるし、フォントマップを見る限り、OTF パッケージでは「細明朝」の存在を意図しているようだから、それらをこれに追加してもいいのだけれど、
  • LaTeX の各種スタイルファイルで普通に組版したときに必要なフォントをまず列挙すべきだろう
  • (埋め込みに関しては様々な意見・議論があるけれど)誰にツッコまれても埋め込みを行って問題ないフォントを確保できる字体を列挙すべきだろう
ということで、上の5種類を列挙しているわけである。まあ、一エンドユーザでも、それなりに気にしていることもあるんですよ、と、そういう話である。

Profile

T.T.Ueda
Tamotsu Thomas UEDA

茨城県水戸市生まれ。

横山大観がかつて学んだ小学校から、旧水戸城址にある中学、高校と進学。この頃から音楽を趣味とするようになる。大学は、学部→修士→博士の各課程に在籍し、某省傘下の研究所に就職、その2ヵ月後に学位を授与される(こういう経緯ですが最終学歴は博士課程「修了」です)。職場の隣の小学校で起こった惨劇は未だに心に深く傷を残している。

その後某自動車関連会社の研究法人で国の研究プロジェクトに参画、プロジェクト終了後は数年の彷徨を経て、某所で教育関連業務に従事。

New Entries

Comment

Categories

Archives(902)

Link

Search

Free

e-mail address:
e-mail address

Counter

11657739