MIME タイプの設定

MIME タイプ条件オプションである mimeinclude、-indmimeinclude、-mimeexclude および -indmimeexclude を使用して、MIME タイプを包含または除外することができます。

構文制限

MIME タイプ条件を指定するときは、以下の制限を守ってください。

ワイルドカード文字(*)の使用

ワイルドカードであるアスタリスク(*)は、MIME タイプ条件の値には正規表現として作用しません。 ワイルドカードは MIME タイプまたは MIME サブタイプ全体を入れ替える場合には使用できます。

たとえば、以下の値は text/html の代用として有効ではありません。

text/*

たとえば、以下の値は text/html の代用として有効です。

text/h*

複数のパラメータ値

MIME タイプ条件の単一インスタンスの一連のパラメータ値を、引用符を使用して指定する場合、各パラメータ値を個々に単一引用符で囲んでください。

たとえば、次のようになります。

-mimeinclude ’text/plain’ ’application/*’

パラメータ値全体を囲む場合、以下のようになります。

-mimeinclude ’text/plain application/*’

表現全体が 1 つの値としてみなされます。

単一のパラメータ値によって、MIME タイプ条件の複数のインスタンスを使用することもできますが、その場合ワイルドカード文字(*)を使用する際にのみ必要です。

たとえば次のようになります。

-mimeinclude text/plain
-mimeinclude ’application/*’.Setting MIME Types

MIME タイプと Web クローリング

Web サイトのインデックスを作成する場合、MIME タイプ条件が そのサイトのホストとなっている Web サーバから送られる「コンテンツタイプ」の HTTP ヘッダーと比べて評価されます。 同Web サーバは、自身の内部テーブルに基づいた MIME タイプ情報をたどります。

MIME タイプが削除されているのを発見したら、インデックスを作成している Web サーバに必要な MIME タイプ情報があることを確認してください。 MIME タイプの指定については、ユーザの Web サーバのマニュアルを参照してください。

ファイルが MIME タイプによってスキップされたことがわかったら、ジョブのログ ファイルのインデックス作成を検査することができます。 たとえば、インデックス作成対象となる典型的な ASCII ファイルはログ ファイル(filename.log)です。 Web サーバが拡張子 .LOG のついたファイルが MIME タイプ text/plain の ASCII テキストであることを理解していないと、ログ ファイルのインデックス作成ジョブにおいて、LOG ファイルが、ユーザによって使用されていても、MIME タイプによってスキップされてしまいます。

-mimeinclude ’text/*’

MIME タイプとファイル システムのインデックス作成

ファイル システムのインデックスを作成する場合、ファイル名が読み込まれ、MIME タイプ条件が既知のMIME タイプおよび関連する拡張子のコンパイル済み内部リストに照らし合わせて評価されます。 ユーザはこのリストを編集できません。 ただし、-mimemapオプションを使用してカスタム MIME タイプ マッピングを作成することができます。

MIME タイプが削除されているのを発見したら、特定の MIME タイプが認識されているかを確認してください。 詳細については、"ファイル システムのインデックス作成の既存 MIME タイプ"のテーブルを参照してください。

ファイルが MIME タイプによってスキップされていることがわかったら、ジョブのログ ファイルのインデックス作成を検査することができます。 たとえば、インデックス作成対象となる典型的な ASCII ファイルはログ ファイル(filename.log)です。 Verity Spider では、拡張子 .LOG のついたファイルは MIME Type text/plain の ASCII テキストであることが理解されないため、ログ ファイルのインデックス作成ジョブにおいて、LOG ファイルが、ユーザによって使用されていても、MIME Typeによってスキップされてしまいます。

-mimeinclude ’text/*’.Setting MIME Types

未知の MIME タイプのインデックス作成

MIME タイプが削除されているのを発見した場合、または Verity Spider の既定設定では未知の拡張子を持つファイルのインデックス作成を行うことがわかっている場合は、-mimemapオプションを使用してファイル拡張子および MIME タイプのユーザ自身のカスタム マッピングが含まれるファイルを指示してください。

正規表現「/」を MIME タイプ条件に使用することもできます。

たとえば次のようになります。

-mimeinclude ’*/*’

各プラットフォームではワイルドカードを含む値に単一引用符を使用することを忘れないでください。

さらに、インデックス作成の対象を正確に管理するために、包含・除外条件を使用してください。

ファイル システムのインデックス作成の既存 MIME タイプ

ファイル システムのインデックス作成の際に Verity Spider によって認識される MIME タイプは、以下の表のとおりです。
形式
MIME タイプ
拡張子
HTML
text/html
htm, html
ASCII
text/plain
txt, text
ASCII、ソース ファイル
text/plain
c, h, cpp, cxx
PDF
application/pdf
pdf
MS Word
application/msword
doc
MS Excel
application/excel
xls
MS PowerPoint
application/vnd.ms-powerpoint
ppt
WordPerfect 5.1
application/wordperfect5.1
wpd
RTF
application/rtf
rtf
FrameMaker MIF
application/vnd.mif
mif