archive.isはサイトの著作権を無視しサイトを丸ごとコピーするのはご存じだと思います。
このブログも一部の画像はライセンス購入した物があるので、ライセンスに違反する為削除してほしい と要求を送ったけれど無視されました。
更にサイトのcanonical、description、keywords、OGP、Twitter情報を書き換えるため悪質です。
なのでうちは、archive.isサーバー群のIPアドレスからの接続をドロップしているのですが、どうも新しいサーバーを用意したみたいです。
(サーバー一覧等はarchive.is サーバーIPアドレス一覧や前回の記事をご覧下さい。)
ちなみに、Googleにインデックスされたarchive.isのコピーサイトはGoogleへ著作権違反の報告をする事で検索インデックスから削除可能です。
私はこのブログの612ページ分を著作権違反で報告し削除してもらいました。
オリジナルサイトとarchive.isのコピーサイトがGoogleのインデックスに登録されてもarchive.isの順位が上がらないのは著作権違反の報告が多く、Webマスター側の権利が認められているからでしょうねー。
アーカイブ保存され困っているWebマスターさんはドンドン著作権違反でarchive.isを報告しましょう!
今回はそのarchive.isに新しいサーバーが増えたようで、見事にダミーサイトがアーカイブされちゃいました。
サーバーはスパム業者を排除しない事で有名なLinode LLCのサーバー。
確認したIPアドレスは139.162.218.90です。
RIRへの照会情報は
% This is the RIPE Database query service. % The objects are in RPSL format. % % The RIPE Database is subject to Terms and Conditions. % See http://www.ripe.net/db/support/db-terms-conditions.pdf % Note: this output has been filtered. % To receive output for a database update, use the "-B" flag. % Information related to '139.162.0.0 - 139.162.255.255' % Abuse contact for '139.162.0.0 - 139.162.255.255' is 'abuse@linode.com' inetnum: 139.162.0.0 - 139.162.255.255 netname: EU-LINODE-20141229 descr: 139.162.0.0/16 org: ORG-LL198-RIPE country: US admin-c: TA2589-RIPE tech-c: TA2589-RIPE tech-c: LA538-RIPE status: LEGACY remarks: For information on "status:" attribute read https://www.ripe.net/data-tools/db/faq/faq-status-values-legacy-resources remarks: Please send abuse reports to abuse@linode.com mnt-by: linode-leg-mnt created: 2004-02-02T16:20:09Z last-modified: 2015-05-05T01:52:02Z source: RIPE organisation: ORG-LL198-RIPE org-name: Linode, LLC org-type: OTHER address: 329 E. Jimmie Leeds Road, Suite A, Galloway, NJ 08205 abuse-c: AR31889-RIPE abuse-mailbox: abuse@linode.com mnt-ref: linode-leg-mnt mnt-by: linode-leg-mnt created: 2015-04-20T03:09:43Z last-modified: 2015-04-20T03:18:36Z source: RIPE # Filtered person: Linode Abuse Support address: 329 E. Jimmie Leeds Road, Suite A, Galloway, NJ 08205, USA phone: +16093807100 abuse-mailbox: abuse@linode.com nic-hdl: LA538-RIPE mnt-by: Linode-mnt created: 2009-11-11T15:16:50Z last-modified: 2015-08-13T19:55:05Z source: RIPE person: Thomas Asaro address: 329 E. Jimmie Leeds Road, Suite A, Galloway, NJ 08205, USA phone: +16093807504 nic-hdl: TA2589-RIPE mnt-by: Linode-mnt created: 2009-11-02T17:17:56Z last-modified: 2014-11-20T18:51:15Z source: RIPE % Information related to '139.162.192.0/19AS15830' route: 139.162.192.0/19 descr: LINODE-UK origin: AS15830 mnt-by: LINODE-LEG-MNT created: 2015-06-17T20:45:47Z last-modified: 2015-06-17T20:45:47Z source: RIPE % This query was served by the RIPE Database Query Service version 1.87.4 (DB-1)
うん紛うことなくLinode LLCのサーバー。
逆引きホスト名もli1381-90.members.linode.comなので間違いなし。
いやー、スパムの苗床Linodeを選ぶとは流石archive.isさん!
アビューズ報告してもレンタル先から処分されないんだから絶好のサーバーですよねー
archive.is サーバーIPアドレス一覧ページは既に反映済みです。
スパムメールとかのサイトを弄って遊ぶみたいに、archive.isでも遊べないかな・・・?と思っていたら、ちょっと面白いことを思いついたので実行してみました。
その面白い内容は・・、archive.isにページデータを無限に送り続けよう!ってお馬鹿な内容。
手頃な物がなかったから円周率100万桁のデータを使ってみる。
データは下記URLのを使わせていただきました。
http://www.geocities.jp/f9305710/PAI1000000.html
$id = htmlspecialchars($_GET['id'], ENT_QUOTES, 'UTF-8', false); <!DOCTYPE html> <html lang="ja"> <head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns/fb#"> <meta charset="UTF-8"> <title>POST- echo $id; - 円周率100万桁を永久に出力する</title> </head> <body> <div id="content"> <header id="header"> <h1>POST- echo $id; [円周率100万桁を永久に出力する]</h1> </header> <div id="entry"> <p> set_time_limit(0); $piData = file_get_contents('./pi.txt'); ob_start(); while (true) { echo $piData; echo '<br/>'; ob_flush(); } </p> </div> </div> </body> </html>
あとはコレをrewriteなんかで動的URLに変換してやるだけ。
RewriteEngine on RewriteRule ^/post\-([0-9]{4})\.html$ /pi.php?id=$1 [L]
早速archive.isに無限データ地獄を味わってもらいます。
どこまでデータをお持ち帰りするかなー?
しばらくロード画面が続いてエラー画面に移動。
どうやら、転送時間が長いとタイムアウトになるみたい。
どれぐらいデータが送信されたかサーバーログを見てみる。
46.166.139.173 - [24/Jun/2016:16:03:18 +0900] "GET /post-1632.html HTTP/1.1" 200 131917490 "https://www.google.com/" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36" 46.166.139.120 - [24/Jun/2016:16:04:56 +0900] "GET /post-1632.html HTTP/1.1" 200 133116756 "https://www.google.com/" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36"
約130MBの円周率データを持って帰ってくれたようですw
時間を見ると約2分でタイムアウトのよう。
送信時間調整すれば保存までいってくれると思います。
これは・・・データサーバーの容量を圧迫して管理費用を増大させることができるかもしれませんw
調整が面倒なら、山ほどゴミexifデータを詰め込んだ重いjpeg画像をrewriteで動的URLにして山ほどimgエレメントを埋め込めば1ファイル単体のタイアウト無視してデータを圧迫できそう。
うちのサーバーは5TBまでは帯域制限が掛からないので、アーカイブが好きなarchive.isさんにガンガンアーカイブさせてやろうと思います。
2016/07/22 (金曜日) 13:00:00
こんにちは、archive.isには悩まされているので、いつも頼りさせていただいております。新サーバの情報、ありがとうございます!さっそくブロックしました。139.で始まる/8アドレスはJPNICの管理じゃないので丸ごと拒否設定してやりましたよ。完全に閲覧者側本位のサービスで意図がわからんです。ついにGoogle が動いたというのは朗報ですね。archive.foまで出てきてまったく頭が痛いですが、これからも頑張って下さい。
2016/07/22 (金曜日) 17:19:05
このような記事でも役にたったようでよかったです。
定期的にサーバーが変わるので安心できませんよね。
私の方でもarchive.is以外のドメインが存在するのは知っていましたが、archive.foドメインが使用され始めているとは思いませんでした。
archive.foはGoogle等へインデックス化が進んでいるようです。
archive.isドメインの信用度が下がったから次のドメインとは・・本当に悪意の塊みたいなサービスですw
2016/07/26 (火曜日) 21:24:06
本日インデックスされていたarchive.foのDMCAが承認されGoogleから削除されました。
知らせていただきありがとうございました。
archive-fo_dmca.jpg