はじめに
Railsアプリでコンタクトフォームやブログのコメント機能を実装している場合、英語のスパムメールやスパムコメントが送信されてくることがあります。何も対策をしていないと結構な頻度で送信されてくるので困っているという方も多いかと思います。
本記事では、英語のスパムメールやスパムコメントを抑制する方法について説明します。
英語のスパム対策
英語のスパムについて
英語のスパムとは、すべて英語で書かれており日本語が含まれていないスパムのことを指します。
もし送信者が日本人ならば、日本語で書いて送信することが普通でしょう。部分的に英語が含まれていることはあり得るにしても、すべて英語で書いて送信する日本人というのはまずいません(まして受信者が日本人なら)。
逆に言うと、送信者が英語圏の人などで、すべて英語でメールやコメントを送信する可能性のあるRailsアプリでは以下の方法は適用できません。本当の(スパムでない)メールやコメントまで抑制することになるので、適用しないようお願いします。
バリデーションの追加
英語のスパム対策として、日本語が含まれないメールやコメントはエラーとするバリデーションを追加します。具体的にはformat
というバリデーションを使用し、「日本語が含まれる」という部分をRubyの正規表現で記述します。
メールやコメントのモデルに以下を追記します。
validates :content, presence: true, format: { with: /[ぁ-んァ-ヶ一-龥]+?/, \
message: 'には日本語を含めてください Content must contain Japanese.' }
/[ぁ-んァ-ヶ一-龥]+?/
という部分が正規表現です。ぁ-ん
はひらがな、ァ-ヶ
はカタカナ、一-龥
は漢字で、いずれか一種類が1文字も含まれていなければバリデーションエラーが発生します。
また、Rubyの正規表現ではUnicodeプロパティによる文字クラスを指定することができます。Unicodeプロパティを使った正規表現は以下のようになります(動作未確認)。
validates :content, presence: true, format: { with: /[\p{Hiragana}\p{Katakana}\p{Han}]+?/, \
message: 'には日本語を含めてください Content must contain Japanese.' }
使用できる文字クラス一覧は以下の通りです。
まとめ
英語のものに限りませんが、スパムというのはロボットを使って自動で送信していることがほとんどです。ですので、あらゆるスパムを抑制するという意味でも、ロボットによる自動送信の対策をしたほうがいいかもしれません。ロボット対策にはGoogleのreCAPTCHA
を設置することが有効です。RailsのGemでも提供されています。
何らかの事情によりreCAPTCHA
が導入できないという場合は、暫定対処として本記事の内容を参考にしていただければと思います。