URLチェッカーダイアログボックス(Ver3.21対応版)
URLチェッカーについての説明
URLチェッカーとは
 URLチェッカーとは、メールの中に書かれているURLを判断材料として迷惑メールかどうか判定する機能です。
 URLの中にあるホスト名を検索サイト(google)で検索し、その結果の中に、そのメールが迷惑メールであることを表すようなリンクがあれば、迷惑メールと判断します。
 URLチェッカーは、迷惑メールフィルターの各種判定動作の中で、一番最後に動作します。他のいろんな条件にマッチせずに「unclear」と判断されたメールについて、最終的にURLチェッカーが動作するようになっています。
 URLチェッカーが動作するにいくつか条件があり、URLの書かれたメールすべてを判定する訳ではありません。

仕様変更:
 URLチェッカーは、以前の秀丸メールでは、「英語のメールはURLに直接アクセス、日本語のメールは検索サイトで調査」って仕様になってましたが、URLにアクセスすることについて不安であるとの声が多くあり、英語メールでの直接アクセスの方式は廃止しました。現在の秀丸メール(Version 6.22以降)では、英語のメールの場合でも検索サイトで調査します。なので、より安心してご利用いただけます。

 秀丸メールのVersion 6.31β23より、URLを含まないメールについても、特定の条件を満たせば、メールの差出人の「@」以降のドメイン名にて検索するようになりました。これによって、URLを含まない迷惑メール類も、ある程度URLチェッカーで調べられるようになりました。


URLチェッカーによる遅延動作
 URLチェッカーは、URLをチェックするのにけっこうな時間がかかります。なので、URLのチェックは秀丸メールの動作と並行して、裏でゆっくり動作するようになっています。
 受信の時にURLチェッカーが動作すると、とりあえずその対象となったメールには、X-TuruKame-Filter:ヘッダの内容として、「checking url...」という文字列が返されます。秀丸メールはそういうメールがあることを認識すると、後で受信が一段落してからURLチェッカーがチェックし終わるのを待った上で、先ほど「checking url...」と返されたメールについてもう一度振り分けを実行するようになります。そうすると改めてその時点でメールが迷惑メールかどうか、瞬時に判定されなおす形になります。

 従って、X-TuruKame-Filter:ヘッダが"checking url..."になるようなメールについては自動振り分けされないように設定しておく必要があります。そうしないと、せっかくURLチェッカーが判定しても、元のメールを振り分け直すことが出来なくなります。


URLチェッカーの結果ファイル
 URLチェッカーが調べた結果は、秀丸メールのデータ用フォルダに2つのファイルとして保存されます。

tkf_URL_Spam.txt ... 迷惑メールと判定されたURL
tkf_URL_Unclear.txt ... 迷惑メールとは判定されなかったURL

 これらのファイルを手作業で編集したり削除したりしてもかまいません。
 これらのファイルに登録されたURL類は、URLが登録されてから180日程度経過すると抹消されていきます。


URLチェッカーを有効にする
 URLチェッカーを使うかどうかを指定します。


受信している最中の自動振り分け時に限ってチェックする
 ここのオプションをONにすると、受信している最中の自動振り分け時にのみURLチェッカーが動作するようになり、手動で「編集・振り分け」を実行した時にはURLチェッカーが動作しなくなります。
 ここのオプションをOFFにしておくと、「編集・振り分け」でURLチェッカーが動作した場合、URLチェッカーの判定が終わるまでしばらく待たされます。大量のメールをまとめてチェックしようとするとかなり待たされる可能性があります。


1通だけは例外的にチェック
 「受信している最中の自動振り分け時に限ってチェックする」とここのオプションを両方ONにしておくと、「編集・振り分け」等のコマンドで迷惑メールフィルターを通す時に、1通だけに限ってはURLチェッカーでチェックします。


短縮URLは迷惑メール扱いする
 URLチェッカーでチェックする対象となったURLが短縮URLだった場合に、そのメールを迷惑メールと判定するか、それともunclear扱いするかを指定します。標準ではOFFになっていて、短縮URLのみ含んだメールでURLチェッカーの判定対象となったメールはそのままunclear扱いとなります。
 ONにすると、短縮URLを含むメールで怪しい物は、すべて迷惑メール扱いとなります。

 ここのオプションは、普通のユーザー様であればONにしてもまず大丈夫だと思いますが、安全のため、標準ではOFFになっています。迷惑メールが非常に多くて困ってる場合はONにしてください。

 短縮URLがチェック対象になった場合、X-TuruKame-Filter:ヘッダの内容は、「unclear (UrlChecker: short URL)」か、またはここのオプションONなら「spam (UrlChecker: short URL)」となります。



日本語メールのチェック - チェックに使う検索サイト
 日本語メールのURLを調べる時に使う検索サイトを指定します。GoogleとYahoo!の両方ONにすると、両方の検索サイトを交互に使います。両方OFFの場合は日本語メールについてのURLチェックはしなくなります。
 日本語メールのチェックに使う検索サイトは、秀丸メールのVersion 6.19から、google1つに固定になりました。
 検索サイトで調べても適当な結果が得られない場合は、その後さらにwhoisサーバーで検索し、もしもドメインの登録日が最近30日以内の場合は迷惑メール扱いとします。

制限事項:
 whoisサーバーは、コンピュータプログラムを使って自動的に頻繁に利用することが禁止されてる場合が多いです。なので、秀丸メールの迷惑メールフィルターでは、1つのwhoisサーバーに対して1日に5回までしか問い合わせしないように制限をかけています。それ以上に問い合わせしたくなった場合は判定出来ず、「unclear」と判定されます。その辺ご了承ください。標準の設定(メール本文の小さいメール限定+外国から発信されたメール限定)で使う場合、問い合わせ制限に達するケースはまず無いと思います。


URLチェックの状態表示を自動的に消す
 URLチェッカーがURLをチェックすると、URLチェックの状態表示というウィンドウが出てきます。(最初は画面の右上に出てきます)。  ここのオプションをONにすると、URLチェックが終わった時に、そのウィンドウを自動的に消します。


デバッグ用のログ出力
 URLチェッカーでの、特に日本語メールのチェックについてのログを出力します。ログは、秀丸メールのメールデータ用フォルダに「tkf_URL_Debug.txt」の名前で出力されます。


プロキシの設定
 プロキシサーバーを通すかどうかの設定、および、通す場合の認証用のアカウント/パスワードを指定します。
 プロキシサーバーが認証を必要とする場合は、認証用のアカウント/パスワードをここで指定しておかないと、URLチェッカーはうまく動作出来ません。
 プロキシサーバーの設定は、迷惑ワードのオンラインアップデートにも関係する設定になります。

参照:プロキシサーバーの設定


URLチェッカーの動作方式
 URLチェッカーは、基本的にgoogleさんに対して問い合わせするのですが、その方式として、秀丸メールV6.62β2からGoogle Custom Search APIを使う方式を追加しました。
 「ブラウザからの検索と同じ方式」を選択すると、通常のブラウザで検索するのと同じ方式で検索します。
 「Google Custom Search API方式」を選択すると、Google Custom Search APIを使って検索します。
 Google Custom Search API方式を選択した場合、ご自身でAPIキーを取得する必要があります。
 Google Custom Search API方式にした方が、spam判定されやすくなります。API経由で検索すると、なぜだか分かりませんが普通のブラウザでの検索よりもヒットする数が少ない傾向があります。ヒット数が0の場合は、API方式の場合に限っては迷惑メールと判定するようにしています。
 API方式の場合はwhois検索することは無くなります。ブラウザ方式でwhois検索になるようなケースはAPI方式の場合はほとんど迷惑メール扱いになります。

参照:APIキーの取得方法



テストボタン
入力されたAPIキーにて正しく検索できるかどうかテストします。うまくいかない場合はAPIキーが正しくない可能性が高いですが、正しいキーのはずなのにダメな場合は、テストした時の表示内容などを作者に連絡ください。




戻る