archive.isの新しいサーバー

archive.isはサイトの著作権を無視しサイトを丸ごとコピーするのはご存じだと思います。
このブログも一部の画像はライセンス購入した物があるので、ライセンスに違反する為削除してほしい と要求を送ったけれど無視されました。

更にサイトのcanonical、description、keywords、OGP、Twitter情報を書き換えるため悪質です。
なのでうちは、archive.isサーバー群のIPアドレスからの接続をドロップしているのですが、どうも新しいサーバーを用意したみたいです。
(サーバー一覧等はarchive.is サーバーIPアドレス一覧前回の記事をご覧下さい。)

ちなみに、Googleにインデックスされたarchive.isのコピーサイトはGoogleへ著作権違反の報告をする事で検索インデックスから削除可能です。
私はこのブログの612ページ分を著作権違反で報告し削除してもらいました。

オリジナルサイトとarchive.isのコピーサイトがGoogleのインデックスに登録されてもarchive.isの順位が上がらないのは著作権違反の報告が多く、Webマスター側の権利が認められているからでしょうねー。
アーカイブ保存され困っているWebマスターさんはドンドン著作権違反でarchive.isを報告しましょう!
 
今回はそのarchive.isに新しいサーバーが増えたようで、見事にダミーサイトがアーカイブされちゃいました。
サーバーはスパム業者を排除しない事で有名なLinode LLCのサーバー。
確認したIPアドレスは139.162.218.90です。
RIRへの照会情報は

% This is the RIPE Database query service.
% The objects are in RPSL format.
%
% The RIPE Database is subject to Terms and Conditions.
% See http://www.ripe.net/db/support/db-terms-conditions.pdf
% Note: this output has been filtered.
% To receive output for a database update, use the "-B" flag.
% Information related to '139.162.0.0 - 139.162.255.255'
% Abuse contact for '139.162.0.0 - 139.162.255.255' is 'abuse@linode.com'
inetnum: 139.162.0.0 - 139.162.255.255
netname: EU-LINODE-20141229
descr: 139.162.0.0/16
org: ORG-LL198-RIPE
country: US
admin-c: TA2589-RIPE
tech-c: TA2589-RIPE
tech-c: LA538-RIPE
status: LEGACY
remarks: For information on "status:" attribute read https://www.ripe.net/data-tools/db/faq/faq-status-values-legacy-resources
remarks: Please send abuse reports to abuse@linode.com
mnt-by: linode-leg-mnt
created: 2004-02-02T16:20:09Z
last-modified: 2015-05-05T01:52:02Z
source: RIPE

organisation: ORG-LL198-RIPE
org-name: Linode, LLC
org-type: OTHER
address: 329 E. Jimmie Leeds Road, Suite A, Galloway, NJ 08205
abuse-c: AR31889-RIPE
abuse-mailbox: abuse@linode.com
mnt-ref: linode-leg-mnt
mnt-by: linode-leg-mnt
created: 2015-04-20T03:09:43Z
last-modified: 2015-04-20T03:18:36Z
source: RIPE # Filtered

person: Linode Abuse Support
address: 329 E. Jimmie Leeds Road, Suite A, Galloway, NJ 08205, USA
phone: +16093807100
abuse-mailbox: abuse@linode.com
nic-hdl: LA538-RIPE
mnt-by: Linode-mnt
created: 2009-11-11T15:16:50Z
last-modified: 2015-08-13T19:55:05Z
source: RIPE

person: Thomas Asaro
address: 329 E. Jimmie Leeds Road, Suite A, Galloway, NJ 08205, USA
phone: +16093807504
nic-hdl: TA2589-RIPE
mnt-by: Linode-mnt
created: 2009-11-02T17:17:56Z
last-modified: 2014-11-20T18:51:15Z
source: RIPE

% Information related to '139.162.192.0/19AS15830'
route: 139.162.192.0/19
descr: LINODE-UK
origin: AS15830
mnt-by: LINODE-LEG-MNT
created: 2015-06-17T20:45:47Z
last-modified: 2015-06-17T20:45:47Z
source: RIPE
% This query was served by the RIPE Database Query Service version 1.87.4 (DB-1)

うん紛うことなくLinode LLCのサーバー。
逆引きホスト名もli1381-90.members.linode.comなので間違いなし。

いやー、スパムの苗床Linodeを選ぶとは流石archive.isさん!
アビューズ報告してもレンタル先から処分されないんだから絶好のサーバーですよねー
archive.is サーバーIPアドレス一覧ページは既に反映済みです。

スパムメールとかのサイトを弄って遊ぶみたいに、archive.isでも遊べないかな・・・?と思っていたら、ちょっと面白いことを思いついたので実行してみました。

その面白い内容は・・、archive.isにページデータを無限に送り続けよう!ってお馬鹿な内容。
手頃な物がなかったから円周率100万桁のデータを使ってみる。
データは下記URLのを使わせていただきました。
http://www.geocities.jp/f9305710/PAI1000000.html

<?php $id = htmlspecialchars($_GET['id'], ENT_QUOTES, 'UTF-8', false); ?>
<!DOCTYPE html>
<html lang="ja">
<head prefix="og: http://ogp.me/ns# fb: http://ogp.me/ns/fb#">
<meta charset="UTF-8">
<title>POST-<?php echo $id; ?> - 円周率100万桁を永久に出力する</title>
 
</head>
<body>
<div id="content">
    <header id="header">
        <h1>POST-<?php echo $id;?> [円周率100万桁を永久に出力する]</h1>
    </header>
    <div id="entry">
        <p>
<?php
 
set_time_limit(0);
$piData = file_get_contents('./pi.txt');
 
ob_start();
while (true) {
    echo $piData;
    echo '<br/>';
    ob_flush();
}
 
?>
        </p>
    </div>
</div>
</body>
</html>

あとはコレをrewriteなんかで動的URLに変換してやるだけ。

RewriteEngine on
RewriteRule ^/post\-([0-9]{4})\.html$ /pi.php?id=$1 [L]

早速archive.isに無限データ地獄を味わってもらいます。
どこまでデータをお持ち帰りするかなー?

しばらくロード画面が続いてエラー画面に移動。
archive.is タイムアウト
どうやら、転送時間が長いとタイムアウトになるみたい。

どれぐらいデータが送信されたかサーバーログを見てみる。

46.166.139.173 - [24/Jun/2016:16:03:18 +0900] "GET /post-1632.html HTTP/1.1" 200 131917490 "https://www.google.com/" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36"
46.166.139.120 - [24/Jun/2016:16:04:56 +0900] "GET /post-1632.html HTTP/1.1" 200 133116756 "https://www.google.com/" "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2228.0 Safari/537.36"

約130MBの円周率データを持って帰ってくれたようですw
時間を見ると約2分でタイムアウトのよう。

送信時間調整すれば保存までいってくれると思います。
これは・・・データサーバーの容量を圧迫して管理費用を増大させることができるかもしれませんw

調整が面倒なら、山ほどゴミexifデータを詰め込んだ重いjpeg画像をrewriteで動的URLにして山ほどimgエレメントを埋め込めば1ファイル単体のタイアウト無視してデータを圧迫できそう。

うちのサーバーは5TBまでは帯域制限が掛からないので、アーカイブが好きなarchive.isさんにガンガンアーカイブさせてやろうと思います。

関連するかもしれない記事



トラックバックURL


スパム対策のためトラックバックURLを動的に生成しています。
生成されるトラックバックURLはコンテンツURLと紐付けされますので、コンテンツURLで指定したサイト以外では使用できませんのでご注意ください。
トラックバックの注意事項などの詳しい説明は About ページを閲覧してください。
「コンテンツURL」を入力し「URL生成」ボタンを押してください。
トラックバックを送る際はあなたの記事やコンテンツにこの記事のURLを書くかリンクしておいてください。
URLがない場合はスパムとして削除され以降の全トラックバックは拒否されます。
  • コメント
  • ピンバック/トラックバック
  1. 1516
    comment
    0
    0
    こーだかID: 2b5uKOvwPfm.c
    2016/07/22 (金曜日) 13:00:00返信

    こんにちは、archive.isには悩まされているので、いつも頼りさせていただいております。新サーバの情報、ありがとうございます!さっそくブロックしました。139.で始まる/8アドレスはJPNICの管理じゃないので丸ごと拒否設定してやりましたよ。完全に閲覧者側本位のサービスで意図がわからんです。ついにGoogle が動いたというのは朗報ですね。archive.foまで出てきてまったく頭が痛いですが、これからも頑張って下さい。

    • 1517
      comment
      0
      0
      れいまID: -
      2016/07/22 (金曜日) 17:19:05

      このような記事でも役にたったようでよかったです。

      定期的にサーバーが変わるので安心できませんよね。
      私の方でもarchive.is以外のドメインが存在するのは知っていましたが、archive.foドメインが使用され始めているとは思いませんでした。
      archive.foはGoogle等へインデックス化が進んでいるようです。

      archive.isドメインの信用度が下がったから次のドメインとは・・本当に悪意の塊みたいなサービスですw

    • 1520
      comment
      0
      0
      れいまID: -
      2016/07/26 (火曜日) 21:24:06

      本日インデックスされていたarchive.foのDMCAが承認されGoogleから削除されました。
      知らせていただきありがとうございました。

      archive-fo_dmca.jpg


コメントを残す

メールアドレスは公開されません、また は必須項目です。
このブログに初めてコメントする方は こちら をご覧ください。


画像認証は待機中です、先にコメント本文を入力して下さい。

コメントを送信しています、しばらくお待ち下さい...
(Akismetスパムデータベース及びブラックリストへの照会を行っています)


キャンセルをした場合でもコメント投稿が完了している場合があります