コピペサイトへの対処1~リンクの否認

2018年6月19日

このブログは開設してからもうすぐ1年になります
その割にはこの記事で14件目とかなり少ないのはこのブログがサブブログ的な位置づけのためです

こっちをメインにしようと考えていた時期もあったのですが、今でも力を入れているのは趣味のゲームのことばかり書いたブログの方だったりします

さて、そんなゲームのことばかり書いたブログの方がコピペ被害にあいました
なんか気味悪いし、こんな弱小ブログをコピペすることにどれほどの利点があるのかわかりませんが、こんなことで私の弱小ブログが検索の圏外に飛ぶのはごめんです

何よりも単にコピペしているだけで自分の言葉で書いていないのを見ていると腹立たしいので、できることをやっておこうと決意した次第です

スポンサーリンク

発見の経緯

自分のブログがコピペされているかどうかを見つけるのは大きくわけて2つあると思います

1つは記事のタイトルやキーワードで検索する方法(通称エゴサーチ)で、もう1つは被リンクから見つけるものです
他にもあると思います
ちなみに私はあまりエゴサーチはしません

今回は後者の被リンクから見つけることができました
コピーサイトから大量に被リンクが張られていたから発見できたというわけです

被リンクとは

自分でホームページやブログを開設していると、いいなぁと思った記事や参考になった記事にハイパーリンクをつけて紹介することは普通にやっていると思います

これは発リンクと言います
(自分発のリンクという意味でいいのかな?)

対して他の人のホームページやブログから自分のサイトの記事へとリンクを張ってもらうことを被リンクと言います

この被リンクの数が多いとグーグルの検索アルゴリズムに「このサイトは多くの被リンクがもらえる質の高いサイトだな」と評価してもらえるわけです

ブラックSEO

たとえコピーサイトとは言え「被リンクを多くもらえているならいいじゃん!」って思うかもしれませんが、そうは問屋がおろしません

一昔前は被リンクの数の多さが自分のサイトの評価の上昇に深く繋がっていて、単なるリンクサイトや不自然な相互リンクを自分で設定することが流行っていたようです

自分のサイトに自分で作ったリンクサイトからリンクを張ることが当たり前のように行われていたという事ですね

しかし、こういった自演行為は内容の伴わないサイトの順位を簡単に押し上げる手段として使われてしまったため、ユーザーからすると質の高い情報を得るのに不便ですよね

ですので、今ではこのやり方はブラックSEOとされて非推奨されています

※SEOとは簡単に言ってしまうと検索順位を上げるための施策、といった所です
ブラックSEOとはブラックなやり方で検索順位を上げる施策というイメージがわかりやすいかと。

今回の私の件に関していえば低品質なコピーサイトから被リンクを受けているわけだし、下手するとグーグルから自演行為と捉えられてもおかしくはないわけです

被リンクの見つけ方

上の方で”コピーサイトから大量に被リンクが張られていたからコピーサイトを発見できた”と書きましたが、どうやって見つけたかというと実はけっこう簡単です

独自ドメインを取得してWordPressでブログを運用しているなら、ほとんどの人が利用しているであろうGoogle Search Consoleを使います

※利用していない人は是非とも利用することをお勧めします
使える機能が多く難しい用語も並んでいますが、今回のようにコピペサイトを発見するのにも役立ちます

Google Search Consoleのトップページから自分のサイトを選択し、検索トラフィックサイトへのリンクと移動すると、自分のサイトへリンクを張っているドメインが一覧となって表示されます

この中では一番上の〇〇〇.xyzが問題のコピーサイトです
右の数字の282は〇〇〇.xyzから282個もの被リンクがあることを表します
普通に考えたらあり得ませんよね
(ちなみに163のリンクがある方は私が登録しているランキングサイトなので問題はありません)

さらに〇〇〇.xyzをクリックすると1つ1つの自分の記事に対して、いくつ被リンクされているかを見ることができます
一番上を見てみると、私の1つの記事に対し26個もリンクが張られているのがわかります
これもやっぱり通常ではおかしいですよね

※私見で恐縮ではありますが、ドメインが.xyzと見慣れないものであるのも判断材料の1つとしています
もちろんドメインのみでの判断は厳禁ですが、.xyzというドメインは安く購入できる(30円とか)ため、詐欺サイトや怪しいサイトに利用されやすい傾向があります

コピーサイトへの対処法

コピーサイトを発見してけしからんと憤慨しているだけでは状況は改善しませんよね
ではコピーサイトを発見したらどのように対処したら良いのでしょうか?

大きく分けると以下に分類されるかと思います

  • リンクの否認
  • 著作権侵害による削除(DMCA)
  • コピーサイトが運用しているサーバーへ通知

この中では下2つのハードルが高いので、今回はリンクの否認について書きます

ちなみに「著作権侵害による削除(DMCA)」は最近公式サイトがTwitter凍結された(艦コレ等)、とかでよく耳にしますね
これは個人情報をある程度さらけ出さないといけないものなので、正直あまりやりたくないです

「コピーサイトが運用しているサーバーへ通知」も動いてくれないことが多いらしいですね

否認の注意点

実際にこのサイトを見に行ってみるとタイトルと記事の前半部分を完コピ、”続きを読む”に私のサイトへのリンクを張っていました
ソース元としてサイト名の記載はありましたが、ソース元を表示したからと言ってコピペしていいわけではありません

一部を引用するなら目くじらを立てたりはしませんが、コピペサイトのやっていることは明確なグーグルの規約違反です
したがってまずはリンクの否認をする事を決意しました

リンクの否認とは「このサイトからリンクを張られているけど自分のサイトの評価の対象としないでくださいね」と、通知するためのものです

今回の私の件ですと、コピペサイトからリンクが張られていることによってサイトの評価が下がる可能性を排除するのが目的です
相手のサイトがなくなってくれるのが一番いいのですがそういうわけにもいきませんしね

ただし、リンクの否認には注意も必要です

以下、Search Consoleより引用

これは高度な機能であるため、慎重に使用する必要があります。使い方を間違えると、Google 検索結果でのサイトのパフォーマンスに悪影響が及ぶ可能性があります。ご自分のサイトに対して、スパム リンク、人為的リンク、品質が低いリンクが数多くあり、それが問題を引き起こしていると確信した場合にのみ、バックリンクを否認することをおすすめします。ほとんどの場合、Google では詳しい情報を提供されなくても、どのリンクが信頼できるものかを評価することが可能なため、標準的なサイトのほとんどではこのツールを使う必要はありません。

参照:バックリンクを否認する

これは「リンクの否認をする機能は提供するけど、Googleではリンクの評価にある程度自身があるから、低品質のリンクの影響を受けていると確信した場合に使ってね」って事ですね

私の場合、リンクの影響を受けていると確信できたわけではないのがやや不安なところです
(っていうかリンクの影響を受けているっていうのはどうやったらわかるのだろう?)

リンクの否認をしようとしたが・・・

リンクの否認はGoogle Search Consoleを使います

Search Consoleヘルプ内にやり方が書いてあるのでその通りにやろうとしたのですが・・・

ヘルプ内の例を見てみると

# example.com のほとんどのリンクは削除されたが、以下のファイルは削除されなかった
http://spam.example.com/stuff/comments.html
http://spam.example.com/stuff/paid-links.html
# shadyseo.com の所有者に 2012 年 7 月 1 日に連絡し
# リンクの削除を依頼したが回答なし
domain:shadyseo.com

参照:バックリンクを否認する

とあります

これを見る限りだと、「リンクの削除の依頼など自分でできる範囲の事をやってみたけど相手が対応してくれなかったのでリンクの否認をお願いします」

という感じでやってね、という意図が読み取れます

したがって一応コピペサイトに削除依頼くらいはしないとグーグルも動いてくれないのかな?と感じたので、削除依頼することにしました
メールアドレスの入力欄がありましたが、ここは捨てアドレスを使って以下のように送っています

あとは1週間程様子を見て、反応がなかったり反論してきたらリンクの否認をしようと。

それからしばらくするとコピペ記事全てが削除されていました
これで大義名分を失ってしまったので、まぁいっかと思いリンクの否認はやめることにしたんです

やはり否認する

リンクの否認について色々と調べたし、それらをブログ記事にしておけば再びコピペされた時に自分用として役立つ時がくるかもしれないと思い、記事作成の確認のためコピペサイトを確認してみると・・・

新しく投稿した記事がコピペされていました

相手からすると「記事の削除について依頼があったから対応したけど、コピペするなとは言われてないからしました」とでも言うつもりなのですかね?

いづれにせよ悪質であることは変わりません

否認の方法

否認の方法については以下の通りに進めます

  1. 否認するURLを記載したtxtファイルを作る
  2. txtファイルをリンク否認ツールページに送信する

あとは結果を待つだけです

否認するURLを記載したtxtファイルを作る

  • Google Search Consoleで自分のサイトを選択
  • ダッシュボードから検索トラフィック-サイトへのリンク-詳細をクリック

  • その他のサンプル リンクをダウンロードするをクリック

  • メモ帳を開き否認したいリンクのURLを記載したtxtファイルを作る
注意点その1
ファイルを作成する際には否認したいURLを1行ずつ記載します
URL以外にコメントを入れたい場合には行の先頭に"#"を入れます
ドメイン毎否認したい場合は、domain:否認したいドメインと記載すればOKです
(上記のSearch Console内ヘルプの例を参照の事)

注意点その2
ファイルは必ずtxtファイルで作成します
エンコードは UTF-8 または 7-bit ASCIIと指定があります
私はUTF-8でエンコードできるsakuraエディタを持っているのでこれで作りました

今回は盗用が再開されたので1記事ずつ否認するのではなく、ドメイン単位で否認することにしました

ブログ記事を投稿すればあちらもコピーするのでいたちごっこですからね

否認リストを送信

否認するリンクのリストを作成したらリンクの否認ツールのページから否認したいリンクのあるサイトを選択し、リンクの否認ボタンを押します

確認メッセージが出るのでもう1度リンクの否認ボタンを押します

作成したファイルを選択し送信ボタンを押します

送信の確認メッセージとメールが来ます
メールの確認も忘れずに。

さいごに

以上がコピペサイトを見つけた経緯とリンクの否認方法です

おそらくはツールを使って自動で記事作成しているのだと思いますが、本当に困っちゃいます

ですが、リンクの否認で私のサイトが影響を受けるリスクはなくなっても、このままだとコピペされ続けてしまいます
さらなる対応が必要ですね