同人サイトのロボ避けアク解について 4

2 : ロボ避け  : 2009/05/06(水) 14:03:29 ID:g3IaiPd40
>>1
乙〜
3 : ロボ避け  : 2009/05/06(水) 15:57:58 ID:VZEGz9TTO
>>1
お疲れ様でした。
4 : ロボ  : 2009/05/06(水) 16:56:40 ID:vDprM/qF0
>>1
乙なんてなんたらかんたら
最近無自覚にPathtraqインストールしてアクセスしてた人がいた
前スレのおかげで弾けてたよありがとう
6 : ロボ  : 2009/05/07(木) 08:07:09 ID:CWOAPg+Z0
>>1
乙です
7 : ロボ避け  : 2009/05/07(木) 10:49:58 ID:V2NPHlL20
百度死ね
8 : ロボ  : 2009/05/07(木) 22:19:16 ID:xYOWmrrz0
>>1
おつです!
9 : ロボ  : 2009/05/09(土) 19:12:28 ID:2J+ntAUw0
一乙
10 : ロボ  : 2009/05/13(水) 17:28:39 ID:oOPrDGrs0
>>1

今日は秘密やが重い。
11 : ロボ  : 2009/05/15(金) 20:09:44 ID:OR35uVnI0
1乙

■同人OK鯖総合スレまとめ

これはもう情報が古すぎて
テンプレからは外した方がいいかもしれないとオモ
12 : ロボ  : 2009/05/18(月) 07:03:37 ID:CTaJF+9n0
すみません
lint避けるにはどう書けばいいのでしょう?
13 : ロボ  : 2009/05/18(月) 18:00:46 ID:uaT41PJ30
deny from lint
14 : ロボ  : 2009/05/19(火) 22:23:52 ID:Z7CIVBdk0
PCサイトだけど携帯で閲覧できるなら別にいいか、と放置してたんだけど
とある携帯訪問者が、その人の携帯のみではうちのサイトが閲覧できないらしく
PCサイト変換サイトから来るんだけど、そのサイトからくると
いつも一緒にグーグルボットを連れてくる
最初は気のせいか?って思ってたけど、変換サイトの後に絶対くっついてる
グーグルボット弾いてるから入ってくることはないんだけど
毎回毎回なのでウザくて仕方ないのでその変換サイト弾いたよ
別の変換サイト使ってくれ
15 : ロボ  : 2009/05/20(水) 08:15:19 ID:8RnBsj9U0
>>14
それ、Google Wireless Transcoder?
自分もうざいと思ってた。
IPがコロコロ変わるからUAで弾けばいいのかな、
でもせっかくの閲覧者がなあ…とか悩み中。
16 : ロボ  : 2009/05/20(水) 08:34:16 ID:G5VFi1ti0
携帯でアクセスするようなのはDQNだからイラネ
17 : ロボ  : 2009/05/20(水) 21:51:27 ID:EQNBIT7a0
>>15
いや、クローラーなんだ
crawl-66-249-73-162.googlebot.com
18 : ロボ  : 2009/05/21(木) 03:50:33 ID:KsrYth1f0
海外IPを全部弾いてる

鯖の生ログで、エラーログの方には99.153.216.189だの99.31.233.154だの
海外IPが乗っているのに、アクセスログの方を同じIPで検索しても引っかからない
通常は403返した時もアクセスログに乗るはずなのに

これは一体どう考えればいいんだ?
19 : ロボ  : 2009/05/21(木) 08:36:09 ID:ZpNmkOJW0
>>17
ごめん
pc変換サイトがグーグルワイヤレスなの?って意味ですた
20 : ロボ  : 2009/05/21(木) 22:52:01 ID:DgtrVqkd0
>>19
いや、ぐるっぽとかいうサイト
21 : ロボ  : 2009/05/22(金) 13:27:17 ID:kkKTafD90
Deny from 74.125.0.0/16 って 74.125.74.154 も含まれるよね?
Google Wireless Transcoder弾こうと思って自分でアクセスしてみたら
74.125.0.0/16で弾けなくて74.125.74.154だと弾ける。なんでだ?
24 : ロボ  : 2009/05/26(火) 13:59:04 ID:eaCAyNp/0
s53.coreserver.jpからアクセスがあるんだが

ぐぐってもWebサービスも何も引っかからない
もちろんリンクを貼られているわけでもない(アカウント名.s53.coreserver.jpになってない)

レン鯖から直接アクセスされるなんてことがあるのか?
25 : ロボ  : 2009/05/26(火) 14:10:09 ID:rRZKTFt4O
それたぶんGENOチェッカー
GENOウィルスのせいで携帯からアクセス増えたけど
弾いてるから申し訳ない感じだ。

自分も聞きたい事があるのに、規制されて
携帯からで思うように投稿できない。早くても来年5月って酷い…
26 : ロボ  : 2009/05/26(火) 17:16:45 ID:LvDhc3KZ0
日本以外のアクセスを弾きたい時ってどう記述すればいいのかな
まとめサイト便利だったのに無くなってて困ってる…
逆に日本だけ許可するようにこんな感じ?

order deny,allow
allow from jp
deny from all
27 : ロボ  : 2009/05/26(火) 17:28:26 ID:eaCAyNp/0
>>24だが

>>25
>それたぶんGENOチェッカー
マジでか、ビビって悪禁しちまった
ウチも携帯弾いてるから悪いことしたな

>>26
日本IPのみallowにしたらいい
リスト公開してるサイトあったよ
28 : ロボ  : 2009/05/26(火) 18:16:35 ID:6qNfhyQp0
>>26
order allow,deny
allow from .jp
deny from env=shutout

うちはこう書いてる
.jpでも弾きたいところをenv=shutoutで指定して更に弾く
.jpじゃない日本のISP(YBBとか)はallow fromで許可を出す
というやりかた
29 : ロボ  : 2009/05/26(火) 19:05:26 ID:rRZKTFt4O
「各国アクセス許可/拒否リスト」でぐぐると、allow記述済みのリスト出てくるよ。
自分は定期的にチェックして、IP羅列してる。
28も書いてるけど、弾きたいIPが追記できる
「Order Allow,Deny」
の方がいい。
30 : ロボ  : 2009/05/27(水) 00:02:27 ID:QHvPG8UT0
レストン!ぐぐってくる
31 : ロボ  : 2009/05/27(水) 06:39:13 ID:IU1pxnJV0
28だけどenv=shutoutじゃないと弾けないみたいに書いてしまった
deny fromでIPやリファを追記しても弾けます、ごめん

上でも出てたGENOチェッカーだけど
弾いているのにサイトをチェッカーにかけると安全度0%と出る…
あてにしないほうがいいと言われてるけど本当にあてにしないほうがいい
32 : ロボ  : 2009/05/27(水) 10:41:41 ID:UTXZEggM0
アクセス解析をみたら、HTML Ggtというのがありました。
ググってみたのですが、メソッドがどうとか記述に関することのようで、
具体的に誰が何をしたらこう出るのかがわかりませんでした
これはロボットなのでしょうか?
34 : ロボ  : 2009/05/27(水) 21:21:16 ID:Jla9N9IE0
>>22
これ、はてな使ってるようだからはてな弾けば済む話じゃね

つか、METAしか使えないような鯖使ってるんじゃいろいろ諦めるしかないぞ
引っ越しな
35 : ロボ  : 2009/05/27(水) 21:22:56 ID:C2zWyFWz0
はてなは弾いてる
使ってるのはYahoo画像検索のようだけど
36 : ロボ  : 2009/05/30(土) 00:27:23 ID:GI6hDa3X0
何かmsnbotが毎日特定の単語(凄い一般的な英単語)の検索結果ページから来るぽ
良く分からん
37 : スペースNo.な-74  : 2009/06/02(火) 06:32:50
あー、ロボスレも脳板に飛ばされたのか
38 : スペースNo.な-74  : 2009/06/02(火) 13:39:34
ロボ避けしてまでサイトやろうという心境がよくわからない
39 : スペースNo.な-74  : 2009/06/02(火) 13:53:24
発信したいのと目立ちたいのは違うのよ
40 : スペースNo.な-74  : 2009/06/02(火) 14:33:44
特定の同士にのみ見てほしいのよ。
心理的にも自己防衛の意味でも、よい子に猥褻な物を見せてしまわないためにも。
41 : スペースNo.な-74  : 2009/06/02(火) 15:21:19
自意識過剰と選民意識の現れ
こういうことに拘るのは大体が女
42 : スペースNo.な-74  : 2009/06/02(火) 15:30:40
スルー検定実施中!
バカ高い検定量は検定協会会長の懐に入ります!
みんな、どしどし応募してね!
43 : スペースNo.な-74  : 2009/06/02(火) 16:23:50
よりにもよって脳板かよ…
自治厨どうしよーもねーな
早速おかしなの湧いてるし

リファラに塩のファイルマネージャーからのアクセスが残ってた
誤爆かなーとは思うがファイルマネージャーで誤爆して行くって
どんな状況なのよ?で気になってしまう…
44 : スペースNo.な-74  : 2009/06/02(火) 20:11:09
まぁロボ避けはノウハウ系でも仕方ない気はするな
閲覧者含めて盛り上がる話題じゃないし
サイト運営している人間ならではのスレだし

今回の管理人関係は全て飛ばすってやり方はどうかと思うが

>>43
ジオでサイト作ってる人が
リンクページとかを編集中にリンク踏んだとか?
またはリファラ誤爆じゃね
46 : スペースNo.な-74  : 2009/06/08(月) 02:34:05
なにそれこわい
47 : スペースNo.な-74  : 2009/06/08(月) 07:37:26
消えたと思ってたら移転か
49 : スペースNo.な-74  : 2009/06/09(火) 01:54:50
すまん、>>45のサイト見てネイバーっていうのが韓国のサーチだっていうのは
分かったんだが何か問題でもあるのか?性質が悪いって何かやったのか?
50 : スペースNo.な-74  : 2009/06/09(火) 02:13:02
>>49
ロボテキを無視する
IPやらホスト指定して弾いてもIP変えリファラ変え
しつこくしつこくクロールしようとする
ロボットの中では「性質が悪い」事でとても有名

yetibot@naver.comが未だにクロールしていて性質が悪い事でも有名だから
日本から出て行っていたとは知らなんだ
つか来るなよもう

NAVERの後にできた
Baiduspaider=百度もロボテキ無視するので嫌われている
52 : スペースNo.な-74  : 2009/06/09(火) 02:21:44
>>50
良く分かった、ありがとう。
ロボ避けしてるサイトにとってはかなり迷惑なサーチなんだな
55 : スペースNo.な-74  : 2009/06/22(月) 20:14:39
こういうUAがあったんだが
Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; GTB5; YTB720; .NET CLR 1.1.4322; niconico)
最後のniconicoってあのニコニコか?なんでUAに?
ググったがUAにniconicoがついてしまう理由が分からなかった。

画像の持ち出しとかされたら恐いんだが…。niconico来た人いる?
56 : スペースNo.な-74  : 2009/06/23(火) 03:38:39
たぶんニコニコ版IE8のことじゃないかな
57 : スペースNo.な-74  : 2009/06/23(火) 23:30:36
>>56
そんなのがあるのか!
特に気にする必要なさそうで良かった。ありがとう。
58 : スペースNo.な-74  : 2009/06/25(木) 19:24:39
Bingになってから画像が引っ掛かるようになった気がする……
59 : スペースNo.な-74  : 2009/06/25(木) 22:23:48
今日こんなのが来てたんだけど一体なんなんだろう

Mozilla/5.0 (000000000; 0; 00000 000 00 0; 00000) DDDDDDDDDDDDDDDDD DDDDDDD DDDD DDDDDD DDDDDDDDDDDD

IPは国内のメジャーなプロバだし、リンク元は自ジャンル幸と至って普通なんだけど、
こんなUA初めて見たんでびっくりしたんだ
ぐぐってもどこかのアク解結果しか出て来ないしすげー怖い
60 : スペースNo.な-74  : 2009/06/25(木) 22:27:24
自分で適当に打ったんじゃないの
61 : スペースNo.な-74  : 2009/06/25(木) 23:00:20
>>59
うちにも同じのきてたよ
偽装UAなんだろうけど、目立ち過ぎて偽装しないほうがまだマシだ
まったく同じUAってことは
UA偽装ツールかブラウザの機能にデフォであるUAなのかもしれないね
62 : スペースNo.な-74  : 2009/06/25(木) 23:19:54
>>60-61
あー偽装か!てんぱっててそこに考えが至らなかったありがとう安心しました

確かに悪目立ちして偽装する意味ないよなこれ…
63 : スペースNo.な-74  : 2009/06/26(金) 02:57:50
偽装するならメジャーなUAにしとかないと意味ないよね
FireFoxのUser Agent Switcherは主なブラウザをリストから選べて便利だ
マカーな自分には手放せないw
64 : スペースNo.な-74  : 2009/06/26(金) 04:23:40
お隣の国の政府機関ドメインからアクセスがあった
何か怖い
65 : スペースNo.な-74  : 2009/06/26(金) 14:29:12
>>64
うわ・・・それはこわい・・・
66 : スペースNo.な-74  : 2009/06/27(土) 01:49:43
IE8ですら弾かれるサイトもあるからIE7に偽装してるが
タダなものは最新でないと気が済まないのでちょっとイラッとする
FLASH使いまくりの企業サイトのくせして……
68 : スペースNo.な-74  : 2009/07/15(水) 02:19:36
.htaccessで学校とかからのアクセスを弾きたいんだけど
調べたらドメインで弾くとサーバーの負担が大きいとあった
弾いてる人はどうやってるの?
69 : スペースNo.な-74  : 2009/07/15(水) 07:20:20
k
70 : 69  : 2009/07/15(水) 07:23:53
ゴメン失敗。

>>68
deny from .go.jp
deny from .lg.jp
deny from .ac.jp
deny from .ed.jp
deny from .ad.jp などはとりあえずドメインで弾いちゃってる。
IPを何千行も羅列するよりは負担小さいんじゃない?と勝手に思い込んでるけどどうなんだろ。
71 : スペースNo.な-74  : 2009/07/15(水) 14:00:54
>>70
自分もそれでやってる
IP個別に弾いてたら何千行になってさすがにやばそうだし
72 : スペースNo.な-74  : 2009/07/16(木) 01:18:00
>>68
うちは>>70+IPで弾いてる
逆引きできないところも結構多いから、結局はIP羅列になるよ
役所や企業も弾いてるから行数は3000近いけど、自分の体感ではそれほど重くはない
73 : 68  : 2009/07/17(金) 08:15:34
ありがとう
あんまりサーバー負担とか気にしなくても平気みたいだね
ドメインで弾くことにする
3000近く弾くとか大変そうだ
74 : スペースNo.な-74  : 2009/07/18(土) 03:08:10
メチャクチャ妖しいアクセスがあった
IPは『222.73.173.11』でUAは『Mozilla/4.0』

以下、解析に残っていたアクセスログ。もちろん全部404

/admin/edit/admin_login.asp
/admin/edit/urlradmin_login.asp
/admin/editor/vwcyadmin_login.asp
/admin/editor/admin_login.asp
/admin/eWeb/rpdaadmin_login.asp
/admin/eWebEditor/admin_login.asp
/admin/eWebEditor/ikabadmin_login.asp
/admin/eWebEditor/admin_login.asp
/admin/omljupfile_flash.asp
/admin/htmledit/admin_login.asp
/admin/htmledit/kejvadmin_login.asp
/admin/SouthidcEditor/admin_login.asp
/admin/SouthidcEditor/viukadmin_login.asp
/admin/upfile_flash.asp
/admin/webeditor/tufaadmin_login.asp
/admin/webeditor/admin_login.asp
/admin/WebEdit/admin_login.asp
/admin/WebEdit/hlifadmin_login.asp
/admins/upfile_flash.asp
/admins/tfaiupfile_flash.asp
75 : 74  : 2009/07/18(土) 03:09:43
続き

/asp_bin/webeditor/admin_login.asp
/asp_bin/webeditor/wazpadmin_login.asp
/azgjUserReg.asp
/CmsEditor/ydruadmin_login.asp
/CmsEditor/admin_login.asp
/edit/admin_login.asp
/edit/whlnadmin_login.asp
/editor/admin_login.asp
/editor/ljhnadmin_login.asp
/eWeb/admin_login.asp
/eWeb/dvycadmin_login.asp
/eWebEditor/rfsiadmin_login.asp
/eWebEditor/admin_login.asp
/ewindoweditor/admin_login.asp
/ewindoweditor/ydmpadmin_login.asp
/htmledit/admin_login.asp
/htmledit/woxjadmin_login.asp
/htmleditor/admin_login.asp
/htmleditor/jhtxadmin_login.asp
/include/tigzupfile_flash.asp
/include/upfile_flash.asp
76 : 74  : 2009/07/18(土) 03:10:42
これで最後

/manage/edit/admin_login.asp
/manage/edit/gjfuadmin_login.asp
/manage/editor/admin_login.asp
/manage/eWebEditor/admin_login.asp
/manage/eWebEditor/iywyadmin_login.asp
/manage/webeditor/kvbjadmin_login.asp
/manage/webeditor/admin_login.asp
/newsadmin/ubb/msniadmin_login.asp
/newsadmin/ubb/admin_login.asp
/UserReg.asp
/upfile_flash.asp
/webeditor/msffadmin_login.asp
/webeditor/admin_login.asp
/WebEdit/admin_login.asp
/WebEdit/riceadmin_login.asp
/WebEdit/admin_login.asp
/zgwlupfile_flash.asp
77 : スペースNo.な-74  : 2009/07/18(土) 12:26:03
>>67
ブログやブログパーツについてる広告を表示するためのbotだから心配ない
79 : スペースNo.な-74  : 2009/07/20(月) 01:37:29
>>78
それはGoogle Wireless Transcoderだよ
PCサイトを携帯用に変換するサービス
81 : スペースNo.な-74  : 2009/07/20(月) 03:43:32
うわー、マジで?
うちもhttp://を含むUAは弾いている
解除しといた方がいいのかなぁ
82 : 78  : 2009/07/20(月) 09:38:35
>>79
ぐるっぽとかファイルシークみたいなものか
安心したよ。どうもありがとう!!
83 : スペースNo.な-74  : 2009/07/20(月) 16:39:55
>>80-81
見れないとなったら1クリックでオフにできるからそのままでいいと思う
84 : スペースNo.な-74  : 2009/07/20(月) 18:34:01
>>83
普通に考えたら、アドオンで弾かれてるなんて思わないんじゃないかな?
うちにきた1人はブラウザ変更したけど、後は去ったよ。
とりあえず解除して、ロボの方を様子見しようと思う。
85 : スペースNo.な-74  : 2009/07/23(木) 18:16:32
torproxy.net?を弾きたいんだけど
どういう記述にしたら良いのかな…
自サイトは絵と写メ日記しかないんでなんだけど
無理矢理魚拓取れるってのもイヤなんで…
86 : スペースNo.な-74  : 2009/07/23(木) 19:43:32
>>85
それ自体を知らなかったけど、調べたら恐ろしいものだね。
単体のサービスの他に、火狐の定番アドオンにも入っていて驚愕した。
リファラとIPで弾いてみたけど、効果があるんだかないんだか…
87 : スペースNo.な-74  : 2009/07/23(木) 19:58:52
初歩的な質問ですいません。
>>86の方等が、リファラやIPで弾く等の対処をする時に
どうやってtorproxy.net等のリファラやIPを調べているんでしょうか。
自分も弾きたいのですが、いつも調べ方が分からずはじけずにいます
88 : スペースNo.な-74  : 2009/07/23(木) 20:09:29
ここは初心者スレじゃないし、調べてもわからんのなら
なんでも同人系スレに聞くんじゃなくて該当板の初心者スレに行きなよ
89 : スペースNo.な-74  : 2009/07/23(木) 20:11:21
>>88
スレチな質問すいませんでした。
該当スレ探してきます。ありがとうございました。
90 : スペースNo.な-74  : 2009/07/23(木) 20:20:40
思うにIPを検索してるだけで、IPを知る方法を検索してないんだと…
torproxy.net 91.121.0.0/16
tor-proxy.net 188.40.0.0/16
でいいのかな?検索したらURLが2種出てきたけど。
91 : スペースNo.な-74  : 2009/07/23(木) 21:13:51
フランスとドイツか
海外全部弾いててよかった
92 : スペースNo.な-74  : 2009/07/23(木) 22:21:05
確かに
日本オンリーにしてると、いろいろ助かるな
94 : スペースNo.な-74  : 2009/07/24(金) 04:01:42
更新チェッカじゃね?
96 : スペースNo.な-74  : 2009/07/24(金) 05:11:42
なるほど目鱗だ!ありがと。
しかし注意書きしかないindexだけチェックされても、1年以上更新されてない…
97 : スペースNo.な-74  : 2009/07/24(金) 09:15:44
>>96
更新チェッカーをブクマ代わりにしてるんでしょ
チェックはついでみたいな
98 : スペースNo.な-74  : 2009/07/27(月) 22:23:08
>>77
遅くなったけどレスありがとう。
とりあえず心配なさそうだけど、しばらく様子を見たところ、
どうやらブラウザから情報が漏れてるのは確定のようで、
気持ち悪くて仕方ない。
こいつが来るようになったのがFirefoxを3.5にしてからなんだけど、
やっぱり何か関係あるんだろうか。
本体のせいなのかアドオンのせいなのか…
99 : スペースNo.な-74  : 2009/07/28(火) 00:07:22
>>98
アメーバブログなんかをやってるサイバーエージェント発らしいけど
その辺のサービス利用してるとかないのかい?
100 : スペースNo.な-74  : 2009/07/28(火) 00:51:44
>>98
自分のブラウザとサイトに来るbotの関連がどこにあるの?
101 : スペースNo.な-74  : 2009/07/28(火) 01:43:22
>>98
どこを見て、漏れてるのを確定したの?
102 : 98  : 2009/07/28(火) 01:50:32
>>99
関係がありそうなサービスは利用してないなあ。
強いて挙げるなら日参してるブログの中にアメブロがあるくらい。

>>100-101
原因がブラウザというのは推測だけど(根拠は前述の通り、
Firefoxを3.5にした直後からだから)、見たページのURLの情報が
どこかに伝わって、それを辿ってロボが来てるのは確実。

>>67の後に、応急処置でとりあえずファイル名だけ変えたんだけど、
数時間後に変更後のURLにロボが来た。
その後も、適当に作った新しいページに、ピンポイントでロボが来る。
もちろんその間、自分以外にそのページは見ていない。

ウイルスの可能性も考えたけど、とりあえずノートン先生は反応しない。
103 : スペースNo.な-74  : 2009/07/28(火) 01:57:08
火狐3.5が原因と断定するなら、アドオンくらいは晒して欲しい
漠然と3.5が原因ですと言われても、うちにはきてないし

あと新しいプロファイル作って
新しいファイルにアクセスしてみた?
104 : スペースNo.な-74  : 2009/07/28(火) 01:59:33
あと忘れてた。クッキーは削除した?
MicroAdにはオプトアウトって機能があって
リサーチするのも、させない人にもクッキー食わせるんだよ
106 : スペースNo.な-74  : 2009/07/31(金) 01:54:19
.twだから台湾かと思ったらアメリカなのか
cart.cgiなんてついてるところを見ると何か売ってるっぽいが
機能は単なるリダイレクタ…?
気味悪いな
107 : スペースNo.な-74  : 2009/07/31(金) 05:57:55
IP: 127.0.0.1
Host: localhost
UserAgent: Mozilla/5.0 (iPhone; U; CPU like Mac OS X; en) AppleWebKit/420+ (KHTML, like Gecko) Version/3.0 Mobile/1A543a Safari/419.3

たまにローカルホストからアクセスあるんだけど、これってなんだろう?偽装?
今回はiPhoneみたいだけど、その前にきたのはMozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)だった
iPhoneってpanda-world.ne.jpだよね…
108 : スペースNo.な-74  : 2009/07/31(金) 23:15:30
>>107
セキュリティソフトの偽装じゃね?>localhost
109 : スペースNo.な-74  : 2009/07/31(金) 23:55:09
セキュリティソフトがローカルホストに偽装なんて、迷惑ってより危険な気がするんだが…
110 : スペースNo.な-74  : 2009/08/01(土) 00:00:51
ちょっとぐぐりゃすぐ見付かるのに……
112 : 111  : 2009/08/01(土) 17:23:18
スマソ。「localhost:4474」がRSSチェッカーの名前みたいになってしまった。
「cococ」というRSSチェッカーが残すリファラが、localhost:4474になるいうことで。
113 : スペースNo.な-74  : 2009/08/01(土) 18:26:35
うちもこの間localhost来てたな
115 : スペースNo.な-74  : 2009/08/02(日) 16:35:19
Trend Micro WTP Add-On 1.2.1046

結構前からこのUAでアクセスがある。いつも同じホスト
アク解のリファラはサーチからなんだが、サーチを更新してもなぜか
前のデータで来る(更新された新しいサーチデータで来ない)
不思議なのでちょっと様子を見るべく、コンテンツの表紙のアドレスを変えたら
404なのにいつもそこにアクセスしている痕跡がある
キャッシュなのか?

ロボ避けとアクセス制限のための覚え書きさんのところを見ても
これは正体不明のようでちょっと不気味
117 : 111  : 2009/08/02(日) 19:35:56
>>114
ありがとう。でもさすがにそれはぐぐってるので…

さくらにメールした人がいるので、さくらスレをしばらく見守ります。
118 : スペースNo.な-74  : 2009/08/03(月) 21:45:59
app:/url_lister.swf ってリファラが来た
ググっても情報ねえwww
119 : スペースNo.な-74  : 2009/08/05(水) 01:11:45

li_viewer larbin2.6.3@unspecified.mail

ググったら情報ありまくるが逆に何だかわからん
120 : スペースNo.な-74  : 2009/08/05(水) 02:26:26
>>116
うちではメインコンテンツのディレクトリに
直リン禁止の.htaccessおいて弾いてる
インデックスは入れるけどコンテンツ見れなきゃいいかなって

インデックスから弾きたい場合は
中韓台弾く(もしくは日本のみ許可の).htaccess置いた方が
精神衛生上いいかも
121 : 116  : 2009/08/07(金) 21:07:05
>>120
ありがとう。
とりあえずインデックスから全部はじきたいので
中韓台(.cn、.kr、.tw)はじく.htaccess置いた

これで様子見る。ありがとう
122 : スペースNo.な-74  : 2009/08/08(土) 02:15:17
>>121
中韓台はそれじゃ弾けないよ。IPで弾かないと
羅列大変だから日本のみ許可の方が楽
123 : スペースNo.な-74  : 2009/08/08(土) 13:19:59
普段ググル先生しか使わないから
MSNサーチが消えてBingっていうのに代わってたことを全然知らなかった・・・
TOPでロボテキ読んだのに、一階層下の裏ページの、しかも作品のリストを踏んでいきおった
htaccessのアクセス拒否は未だMSNのサーチ結果からしか弾いてなかったし、夜中に青ざめたよ
124 : スペースNo.な-74  : 2009/08/08(土) 21:51:35
>MSNサーチが消えてBingっていうのに代わってた

うへっ
今、この瞬間に初めて知った
125 : スペースNo.な-74  : 2009/08/08(土) 23:34:49
MSNが名前変えまくって糞ってな事は記事で見たんだけど
ロボテキ無視するとは…本当に糞だな
どうにかして弾かないと
126 : スペースNo.な-74  : 2009/08/09(日) 09:56:15
そういえば忍者のアクセス制限って、あれって.htaccessなの?
cgiってあるけどそれじゃjava切ったら入れちゃうってこと?
127 : スペースNo.な-74  : 2009/08/09(日) 10:10:04
バリアのこと?
あれ使ってるところをjavaScriptオフで見ると
ニンジャの人出てきてサイト閲覧できん
128 : スペースNo.な-74  : 2009/08/09(日) 11:36:49
あ、そうなんだ
では一応効果はあるってことだねありがとう
129 : スペースNo.な-74  : 2009/08/09(日) 13:15:19
忍者バリアはJavaScript切っているのを弾くか否かの選択ができる
JavaScript無効に許可出していると見れちゃうよ
130 : スペースNo.な-74  : 2009/08/09(日) 14:31:36
セキュリティ重視でいつもJavaScript切ったままだから
忍者で弾かれると二度と行かなくなるな
そういう意味でも効果はあるよ
131 : スペースNo.な-74  : 2009/08/10(月) 03:00:56
>>130
自分も。メニューにjs使ってるようなサイトも行かない。
ウィルス騒ぎの時、セキュリティがどーのと注意書きしてたサイトが
js入れないと閲覧出来なくて笑った。
132 : スペースNo.な-74  : 2009/08/10(月) 23:07:17
オンラインブクマ禁止といっておきながらリンクページがあって
幸登録してるようなもんか
133 : スペースNo.な-74  : 2009/08/10(月) 23:23:17
沢山いるよなそういうアホ
134 : スペースNo.な-74  : 2009/08/11(火) 02:52:23
おまえら、はてな(アンテナ/ブックマークetc)は弾いてる?

.hatena.ne.jpで指定しててアンテナは弾けるけど
アンテナにはサイトが載ってしかも弾いた事が外部から分かっちゃうんだよな
どうにかならんかなこの仕様

ブックマークも.htaccessじゃ弾けねえし
metaタグなら弾けるんだがソースに記入しないと駄目だし
「はてなを弾いてる」ってことを外部から見えずに弾く事は不可能なんかな

否定的な意見書き込まれるのが嫌で掲示板(拍手)類置いてないのに
はてブだとそれが書き込まれたとき永遠に外部に晒され続けられるのが嫌だ
135 : スペースNo.な-74  : 2009/08/11(火) 02:59:20
はてなってよく分からないんだよな
自分は別に弾いてないし以前は平気だったのに
最近403になっちゃってる
設定変えてないのにな
アクセス弾いてるって出てるんかな
そのつもりはないからちと困るな

>否定的な意見書き込まれるのが嫌で掲示板(拍手)類置いてないのに
>はてブだとそれが書き込まれたとき永遠に外部に晒され続けられるのが嫌だ

はてブに限らず書こうと思えば方法はいくらでもあるんだ
それすら嫌なら書かれたら引っ越しして行方をくらますくらいしか思いつかん
136 : スペースNo.な-74  : 2009/08/11(火) 07:07:32
知られても構わないから、普通に.htaccessとmetaで弾いてるよ。
はてなの住人全員じゃないが、どうしても相容れない感じがして
あの辺になんて思われても構わないと思ってる。
137 : スペースNo.な-74  : 2009/08/11(火) 07:34:27
はてな自体嫌いだから弾いてる
あの他人のふんどしでという雰囲気が……
138 : スペースNo.な-74  : 2009/08/11(火) 09:14:07
はてな嫌い
139 : スペースNo.な-74  : 2009/08/11(火) 21:44:16
hatenaとgoogle関係は全部はじく
140 : スペースNo.な-74  : 2009/08/11(火) 22:00:55
自分で登録したサーチ以外のリファは全部弾いている
ぐぐるやMSN(Bing)や百度を始めとする検索も全部弾いている
hatenaはリファを見たことがないが、もしあったら弾くと思う

自分が好きで登録したサーチ+同ジャンルリンク以外は全部弾く
141 : スペースNo.な-74  : 2009/08/11(火) 22:50:38
>>139
Google全部弾くと不便じゃない?
WEBマスターツールとか

自分Megaupload関係を全部弾いてるけど
勝手にインスコされちゃう人もいるんだね
でも勝手にインスコされちゃうような甘い人はどうでもいいか
142 : スペースNo.な-74  : 2009/08/12(水) 03:47:24
>>141
WEBマスターツールやらを見てみたけど
検索ロボを弾きたいサイトにはいらん機能のような気がするが…
143 : スペースNo.な-74  : 2009/08/12(水) 04:21:54
>>142
ぐぐるは弾いても、インデックスされちゃう可能性があるけど
Webマスターツールなら、自分で削除できる
144 : スペースNo.な-74  : 2009/08/14(金) 17:06:28
webマスターツール使ってるけどサイト確認の時だけGoogle通して確認が終ったら
.htaccessとrobots.txtとmetaタグで弾いてるよ
ブロックしなきゃツールもURL削除してくれないし
145 : スペースNo.な-74  : 2009/08/14(金) 19:59:53
Google指定のHTMLとロボテキに許可出して
ツールにURL登録しっぱなしだけど、特に問題ないな。
気が向くと確認に行って、ロボの巡回を少なくしてるくらいかな。
147 : スペースNo.な-74  : 2009/08/15(土) 09:31:13
>>146
一行目SetEnvIf Refereになってるのはタイプミスだよね?

翻訳はリンクじゃないからSetEnvIf Refererじゃ防げない
SetEnvIf Hostで自サイト以外のホストは弾くといいよ
(SetEnvIf Remote_Hostではないので注意)
148 : スペースNo.な-74  : 2009/08/15(土) 19:03:17
NAVERてUser-Agentじゃ弾けない?
149 : スペースNo.な-74  : 2009/08/15(土) 19:24:54
htaccesssでjpのみ許可(com.netは一つ一つ追加)なのに
pacbell.netっていうのが時々足跡残してる。
トップより下層のページはdeny from .pacbell.netで弾いてるのに入ってきてる。
調べてみたけどよくわからん…。
スパムロボみたいなもの?
150 : スペースNo.な-74  : 2009/08/16(日) 06:09:07
>>149
うちも毎日何度もきてウザイ。
生ログ確認したら、日本IPのみ許可で弾けてはいるみたいではいる。
検索するとメジャーなプロバみたいだね。スパムに汚染されてるけど。
151 : スペースNo.な-74  : 2009/08/17(月) 20:01:51
スレチだったらごめん

最近、携帯からgoogleのPCサイト変換を使って来る人がいるんだが、
リンク元が「(http〜)banner.jpg?_gwt_pg=1」ってなってるんだ。
_gwt_pg=1はgoogleの変換機能の何かだと思うんだけど
「banner.jpg」から飛んで来るってどういうことかな?
152 : スペースNo.な-74  : 2009/08/18(火) 02:03:27
>>151
携帯は誤爆しまくるから、リンク集のバナーのURLも何かしら残っちゃうんじゃない?
仕組みはさっぱりだが、今までもとんでもない誤爆が多々あったから。
153 : 146  : 2009/08/19(水) 07:30:27
>>147
遅レスですみません。
お察しの通りSetEnvIf Refereはタイプミス(というかコピペミス)でした。
SetEnvIf Hostやってみたらどうもうまく弾けていないのか
やはりトップページは翻訳結果窓に出て来る。
ただトップページ以下のディレクトリはトップページのリファラがないと閲覧できないようにしていて
それでNAVER翻訳経由だと中身に入れなくなっているみたいです。
トップページしか見られないのでとりあえずそれでいいかなあ。
154 : スペースNo.な-74  : 2009/08/19(水) 12:52:55
>>153
普通に鯖のIPの範囲で弾いたら?
今試したら他サイトは表示されたけど、日本のIPのみ許可の自サイトは
正常に翻訳出来ませんと表示が出た。
翻訳結果窓に403とはでなかった。
155 : スペースNo.な-74  : 2009/08/19(水) 15:13:16
>>154
調べたらNAVER翻訳は利用者のIPやホストが出るみたい。
海外暮らしや外国人の閲覧者の方もいらっしゃるので
自分のサイトを日本のIPのみ許可にはできないです。
156 : スペースNo.な-74  : 2009/08/19(水) 15:30:14
海外利用者の事を考えているのに翻訳が禁止…
もちろんどんな運営も自由だけど少し不思議に思った
157 : スペースNo.な-74  : 2009/08/19(水) 16:47:21
他の翻訳は制限しないけどNAVERだけは弾きたいんです。
まあ弾きたい理由もきちんとした理由でもないんですが。
158 : スペースNo.な-74  : 2009/08/19(水) 18:15:48
>>156
日本語読める海外在住者はOKだけど
日本語読めなくて翻訳通さなきゃいけない海外在住者は弾きたい
ということでは?
159 : スペースNo.な-74  : 2009/08/19(水) 18:21:29
>>157じゃないけど自分は>>158の言ってる理由で日本のみにできないでいる
160 : スペースNo.な-74  : 2009/08/19(水) 23:31:59
特別版権に厳しくない普通の漫画ジャンルで一番大きい幸に
検索避けのメタタグが入っているんだけどこれって意味あるの?
作品名+サーチでググると普通にトップに来ている。
161 : スペースNo.な-74  : 2009/08/20(木) 10:44:44
ググってTOPならあんま意味ねーなw
162 : スペースNo.な-74  : 2009/08/20(木) 13:23:21
タグ間違ってるんじゃないの?
それかリンク多くてインデックスされちゃってるかも
163 : スペースNo.な-74  : 2009/08/20(木) 13:53:50
アーカイブのメタ入れてないとか別に気にしてないけど一応いれとこかとか?
164 : スペースNo.な-74  : 2009/08/20(木) 21:43:09
「ロボ避けしているサイト様に限ってリンクフリー」って書いてるサイトが
ロボ避けしてないサーチエンジンや同盟に平気で登録してたりするよね
165 : スペースNo.な-74  : 2009/08/20(木) 22:08:35
それ前どこかのスレで話題になって
自分で管理修正できる幸登録はいいけど
出来ない他サイトからの被リンクは〜っていう話がでていた
166 : スペースNo.な-74  : 2009/08/20(木) 22:57:53
つか検索避けがhtaccess使用なら、
ロボ(例えばぐぐるや百度)の集めたキャッシュからの
アクセスも403を返せるという事なんだが…

自分はそれで検索にガスガス登録している
無論ぐぐるキャッシュからは403が出ることを確認済

もっとも「ロボ避けしているサイト様に限り(ry」は書いていないがw
167 : スペースNo.な-74  : 2009/08/20(木) 23:05:23
え、そういう問題だったの、この流れ
168 : スペースNo.な-74  : 2009/08/20(木) 23:07:02
論点が突然ズレました
169 : スペースNo.な-74  : 2009/08/21(金) 22:31:25
サイトのリンクポリシーに「オンラインブックマークはしないで下さい」と
高圧的に書きながらリンクページがある人の中のオンラインブクマの定義って
何なんだろうな…
前に少しだけ話した人はメールやmixiなどのメッセージ欄に
書いてあるURLから飛ぶことをオンラインブクマだと言ってて
なんかあまりにも堂々としてたんで訂正しここねた
170 : スペースNo.な-74  : 2009/08/21(金) 22:33:15
しここねたなんて打つ奴に説得力があるとでも
171 : スペースNo.な-74  : 2009/08/22(土) 01:26:27
ぐぐってみたところ
オンラインブックマーク→専門のサイトに登録して利用するサービス
らしいよ
リンクページとは別物として扱われていると思う
172 : スペースNo.な-74  : 2009/08/22(土) 01:28:59
>171
ナイスボケ
173 : スペースNo.な-74  : 2009/08/24(月) 14:48:18
携帯だがエムブロのプロフィールに検索避けをかけたくて仕方ない
174 : スペースNo.な-74  : 2009/09/03(木) 17:36:01
当方二次サイトで、年齢制限やら同性愛やらの要素は一切ないんだけど
それでも同人サイトなら検索避けって入れておくべき?

あと、検索避け入れておくべきなら、登録してるサーチの検索結果なんかが
普通に検索にかかるんだけど、そのサーチも解除すべきかな?
175 : スペースNo.な-74  : 2009/09/03(木) 17:47:52
自己解決で申し訳ないんですけど、やっぱり入れといても損はないだろうと思ったのでいれることにした
けどサーチの検索結果が引っかかる件はどうしたものか
176 : スペースNo.な-74  : 2009/09/03(木) 18:31:10
>>174
自己解決したようだけど、入れるべきかどうかの判断は管理人次第だから聞いても仕方ない。
引っかかるのが嫌なら、幸解除しかない。

ジャンルがナマモノとかなら避けろ、弾け、鍵かけろ、幸に登録すんなと勧めるけどさ。
177 : スペースNo.な-74  : 2009/09/03(木) 18:33:19
自分も自サイトは検索避けしててサイト名じゃ引っかからないけど
サーチがどこも軒並みガッツリ上がってくる
開設1年未満のヒヨッコサイトだから抜けたくないんだけど
気になるならやっぱり解除しかないんだろうか
178 : スペースNo.な-74  : 2009/09/03(木) 18:44:03
>>176
自分自身は問題ないんだけど、リンク貼らせていただいてるサイトに
迷惑かかることとかあるのかなと思って
今のところ何もないようだから、そのままでいいか
179 : スペースNo.な-74  : 2009/09/03(木) 18:52:59
>>177
検索避けしてる幸を使うしかない
自分は幸が引っかかるのは気にしてないけど、ぐぐるやアホー経由は弾いている
そういう住人はここでは多いと思う

>>178
相手サイトにリンクの注意書きがあるなら、従った方がいいだろうけど
そうでもなければ普通は気にしなくていいと思う
180 : スペースNo.な-74  : 2009/09/03(木) 20:14:51
>>179
そっかそっか、ありがとう
181 : スペースNo.な-74  : 2009/09/04(金) 23:27:05
忍者のバナーって隠せたっけ?
182 : スペースNo.な-74  : 2009/09/04(金) 23:32:34
有料ならバナー無しだよ
183 : スペースNo.な-74  : 2009/09/05(土) 07:29:53
そうなんだ。ありがとう
184 : スペースNo.な-74  : 2009/09/08(火) 11:15:34
真夜中頃からひみつやが不安定。
186 : スペースNo.な-74  : 2009/09/22(火) 00:18:29
トラックバックの付いてないトラバ画面がリファラーの上位に来てるって事は
スクリプトによるスパムの対象になってるってことだよね……
187 : スペースNo.な-74  : 2009/09/22(火) 08:41:34
>186
Akismet入れるよろしw
188 : スペースNo.な-74  : 2009/09/24(木) 09:04:10
Host: s327.xrea.com
UA: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; QQDownload 1.7)
言語: 中国語/中国

こんなのが結構きて、コンパネにログインしようと頑張られた。
ぐぐっても中国語メッセンジャー関係で、余計なモノもインスコされる。
とにかくいろいろ問題起こしてるって事くらいしか分からなかった

しかもなんでxreaなの?
ブログの垢ハックに関わることの多いUAらしいけど
またxreaがハックされたんだろうか?
189 : スペースNo.な-74  : 2009/09/28(月) 20:36:25
>>187
実際には書き込まれてないんじゃ意味ないんじゃね
190 : スペースNo.な-74  : 2009/10/11(日) 04:28:08
ool-4b7fb172.static.optonline.netて解析に残ってた
どうもロボっぽいんだけど、弾き方がよくわからん
191 : スペースNo.な-74  : 2009/10/11(日) 10:20:23
>>190
ロボっていうかスパムなんじゃ
192 : スペースNo.な-74  : 2009/10/18(日) 22:32:04
百℃が嫌で手当たり次第にhtaccessに記述したら
「携帯から見られません」って連絡が来た。
どの記述のせいなのかがわからねえ……
193 : スペースNo.な-74  : 2009/10/19(月) 09:01:54
携帯からの閲覧を諦めてもらう。
連絡できたってことは他の手段で閲覧可能な状態だろうし。
194 : スペースNo.な-74  : 2009/10/19(月) 10:45:41
>>192
リファラ残さないものは全部弾いちゃってるとか
うちも画像直リン禁止の記述を書いたら携帯から画像の表示が全くされなくなってたし
195 : スペースNo.な-74  : 2009/10/19(月) 11:43:50
携帯にも見せようと頑張ると結構支障がでるんだよね…
別に携帯で見てもらわなくていい
196 : スペースNo.な-74  : 2009/10/19(月) 19:30:50
http入りのUAを弾いたら
自分の火狐から見られなくなってた
アドオン油断ならん
197 : スペースNo.な-74  : 2009/10/20(火) 18:55:01
>>196
でもhttp入りのUA弾くのが一番手軽なんだよな
自分はもう、ごめんなさいと思いながらそのままにしてる
198 : スペースNo.な-74  : 2009/10/25(日) 13:17:54
>>196
前も書いたけど、メジャーなアドオンなんだよね…
結構な人数弾いちゃうから、書き方見直したよ
199 : スペースNo.な-74  : 2009/10/25(日) 16:44:21
自分もhttpで弾いてたけど
巻き込んじゃう人に申し訳ないからhtaccessを書き直したよ
なにもしてないのに弾かれたら嫌な思いさせるしね
200 : スペースNo.な-74  : 2009/11/07(土) 12:58:51
自分もhttp入りは弾いてる。
だってロクなのこないし。
201 : スペースNo.な-74  : 2009/11/17(火) 00:17:32
生ログ見てたらUAのないアクセスがあったんだけどなんだろうこれ
弾けてるけどなんだかわかんなくて気になる
IPの逆引きできなかったけどどうやら韓国らしい
202 : スペースNo.な-74  : 2009/11/17(火) 07:32:50
UA晒してみて
203 : スペースNo.な-74  : 2009/11/17(火) 09:07:57
UAないって言ってるじゃんw
時々UAのないアクセスあるよね
自分はUA不明のものは不安だから弾いてる
204 : スペースNo.な-74  : 2009/11/17(火) 12:26:08
.pool.ukrtel.net

94.178.0.0/15
95.132.0.0/14

エロ画像ブログのリファラでアクセスしてきたので弾いた。
205 : スペースNo.な-74  : 2009/11/18(水) 07:35:42
リファラスパムじゃね?
206 : 204  : 2009/11/18(水) 08:50:34
>>205
そのようだね。
207 : スペースNo.な-74  : 2009/11/21(土) 10:12:46
火狐でUA偽装するアドオンがあるけど、あれで
ごく普通のUAのフリして(火狐→IEとか)入ろうとするとブラウザが落ちる
サイトがある。何を仕込んでああなるんだろう
208 : スペースNo.な-74  : 2009/11/21(土) 10:18:32
偽装しておいてサイトのせいにするとか随分といい態度の閲覧者様だこと
209 : スペースNo.な-74  : 2009/11/21(土) 10:44:16
火狐でも崩れないレイアウトにしてから言ってくれ
210 : スペースNo.な-74  : 2009/11/21(土) 10:52:39
クソブラウザ利用者は態度もクソって訳ですね
211 : スペースNo.な-74  : 2009/11/21(土) 19:11:00
>>207
サイトに余計なJS仕込んでんじゃないかな
そういうサイトはろくなもんじゃないし行かなきゃいい
212 : スペースNo.な-74  : 2009/11/21(土) 22:06:50
解析厨の痛管$がまさに207みたいなサイトだったな
213 : スペースNo.な-74  : 2009/11/25(水) 00:27:32
相談です。
検索避け覚書のサンプルに
ディレクトリの一覧表示防止加えたhtaccessにしてるんだけど
なぜかad.jpを403で弾いてしまってるみたいなんだ。
上で出てた火狐のアドオンのせいかと思ってhttpを許可してみたんだけど
まだad.jpを弾いてる・・・なんでだろう
214 : スペースNo.な-74  : 2009/11/25(水) 08:12:28
管雑961の人だよね
うちもなぜかBIGLOBEを弾いてしまってる
DNSサーバーの関係なのかなと思ってるけど
正確なことはわからない
うちは.jpのみ許可しているせいか
.jpなのに弾いてしまうISPが結構あるんだけど

根本的な解決にならなくて悪いけど
ネットマスクで許可出せばBIGLOBEの人も見られるようになるよ

allow from 210.147.0.0/16
215 : スペースNo.な-74  : 2009/11/25(水) 11:14:47
すっげ面倒だけどコピペで国内IPのみ許可にしてる
どこかに国内IPまとめサイトあったと思うんだ

問題は国内特定IPを弾きたいときに
ネットマスクからどう外したもんかと悩むことか
(現在はhtaccessで弾くのを諦めてCGIに規制かけてる)

国外からのアクセスは全部弾いて平和なのぜ
(海外からの無断転載が酷いジャンル)
216 : 213  : 2009/11/25(水) 11:24:30
ありがとう!
とりあえずBIGLOBEのad.jpがほとんどだったから
それで対応してみます
本当に感謝!

国内IPもちょっと調べてみるよ
217 : スペースNo.な-74  : 2009/11/25(水) 20:59:58
そういや自分もad.jp弾いてた
学校関係がad.jpだからな

大手袋はad.jpから変更するべき
218 : スペースNo.な-74  : 2009/11/25(水) 21:15:35
ad.jpは学校じゃない所もあるし
学校でも大学だから問題があっても自己責任だろ、と思って弾いてないな
219 : スペースNo.な-74  : 2009/11/25(水) 21:46:51
ad.jpって学校?
大学はacだし、高校とか小学とか専門学校?
220 : スペースNo.な-74  : 2009/11/25(水) 21:54:07
>>219
あれっ
勘違いしてたゴメン
ac.jpの話
221 : スペースNo.な-74  : 2009/11/25(水) 22:11:10
小中高校はed.jpだね
222 : スペースNo.な-74  : 2009/11/25(水) 22:37:25
話題のac.jpでなんか引っかかった。

crawl234.tkl.iis.u-tokyo.ac.jp

18禁って言うこともあってac.jpとか学校関連は弾いてたから
エンターでお帰りしてもらったんだけど、初めて見たから気になって
調べてみたら東大関連なのね。
223 : スペースNo.な-74  : 2009/11/25(水) 23:10:09
天下の東大からクローラーが来てるのか
224 : スペースNo.な-74  : 2009/11/25(水) 23:15:40
東大、筑波大、京大その他もろもろのクローラーきてんぞ
以外とアタックかけてきたりは、大学系のホストで悪戯しでかしてくる奴多い
さっくり学校に通報してやって止まるけど、次がきたりでイタチごっこだ
225 : スペースNo.な-74  : 2009/11/29(日) 14:33:30
何だか最近異様にパストラック使用者が増えてきた
弾いてるから害はないとはいえ
アクセスログ送信して共有されちゃうなんて
同人サイトでは蛇蝎のごとく嫌われそうなものなのにな
ジャンルによるのかもしれないけど
226 : スペースNo.な-74  : 2009/11/29(日) 14:55:12
前に一部のブラウザにデフォで入ってるって報告なかったっけ?
知らずに使ってる人が多いんじゃないか
227 : スペースNo.な-74  : 2009/11/29(日) 17:34:30
>>225-226
うちはどうかと思って久々にログビューア開けたら
パストラックはいつのまにか弾き済みだったけど
(たぶんここの過去スレを見てたおかげ)

裏請求メールがいろいろと論外だったので無視したことのあるホストが、
それっぽいディレクトリ名で闇雲にがんがんアクセスしてきていて404の嵐…
うちピコなので、こういうことされたら目立つ目立つw
228 : スペースNo.な-74  : 2009/12/04(金) 23:37:13
127.0.0.1っていうIPからバナー呼び出しが毎日あるんだけど
これってlocal鯖だよね…?
229 : スペースNo.な-74  : 2009/12/09(水) 20:30:49
>>228
多分間違いないと思うよ。
どうせどっかの学生やなんかが課題とかでApache起動させて
そのローカルホストに作ったウェブページにバナー乗っけてるんだと思う。

たいていしばらくしたらページ見なくなるからほって置いても大丈夫。
231 : スペースNo.な-74  : 2009/12/12(土) 20:56:00
MMO(ネトゲ/オンラインゲーム)のサイトだが
tp://lineage.paix.jp/guide/spam/htaccess.txt
こんなのがあった

上記は中韓やプロキシ制限のhtaccess記述で、
内容の説明は以下
tp://lineage.paix.jp/guide/spam/auth-htaccess.html
232 : スペースNo.な-74  : 2009/12/15(火) 00:29:35
全てを弾いて日本ドメインだけを許可したいけど
教育機関は弾きたいって場合はどういう順番で記述すればいいの?
頭こんがらがって来た
233 : スペースNo.な-74  : 2009/12/15(火) 00:41:10
>>232
自分のIPで試してみたんだが

allow,denyの順番で
国内IP許可、国外不許可を記述、
それから国内教育機関のドメインもdenyに入れておいたら
ちゃんと弾かれていた
(自分のIPをdenyに入れて試したら、403が帰ってきた)
234 : スペースNo.な-74  : 2009/12/21(月) 22:30:22
教育機関からのアクセス弾きたいけど、どうも寮みたいでなかなか踏み出せない
公共の場からの閲覧やめて、とは書いてあるんだが
なぜかyahooとかの会社からも来てるし、仕事中になにやってんだっていう……
ああどうしよっかなーと今日もそのままで終わる
235 : スペースNo.な-74  : 2009/12/25(金) 17:12:41
アクセスログ点検してたら「ヤフー株式会社」のIPがあって
クローラなのか生身の人が見に来てるのか確認のためにUA見てみたら
Googleツールバー入れてて噴いた
236 : スペースNo.な-74  : 2009/12/25(金) 20:11:12
中の人は正直だな
237 : スペースNo.な-74  : 2010/01/16(土) 15:53:39
めんどくさいけどやった方がいいかな
238 : スペースNo.な-74  : 2010/01/17(日) 09:52:24
ISPが学校法人でad.jpってのがあったんだけど
接続時間が真夜中なんで学校ではなさそう
これって一般の人で学生ではない可能性ってある?
一般向にもやってるISPだったら弾くのは忍びないとおもいつつ
アドレス削ってもプロバイダ業をやってるわけではなさそう
緩いジャンルでそこまで厳しくするのもなと思い迷ってる
239 : スペースNo.な-74  : 2010/01/17(日) 10:00:18
whoisで調べれば一般向にもやってるISPかどうかわかりそうなもんだけど
ググっても特に引っかからないなら学生寮からのアクセスじゃないか?
240 : スペースNo.な-74  : 2010/01/17(日) 10:08:17
大学とか専門って結構夜中でも学生生息してるしな
研究とか携わってる理系とかは、研究室内巣が出来てたりするし
演劇系でも深夜泊り可能な所もある
寮の可能性だってあるし、いちいちそんなの気にしてキモチワルイよ
解析厨なの?
241 : スペースNo.な-74  : 2010/01/17(日) 11:24:07
ここの住人で解析厨じゃない人がいるなんて初耳だ
242 : スペースNo.な-74  : 2010/01/17(日) 11:44:40
大学の研究かなんかのロボが
けっこうくるからacまとめてはじくようになった
243 : 242  : 2010/01/17(日) 12:18:08
あ、238のはadなんだね
話ずらしちゃってごめん
245 : スペースNo.な-74  : 2010/01/21(木) 01:45:51
>>244
その書き方だと許可出してないよね?

それに許可出してから弾いてるから
結局http全部弾かれるんじゃないのかな?
246 : スペースNo.な-74  : 2010/01/23(土) 14:13:01
>>244
アドオン入れてるからやってみたら弾かれずに入れたよ
!noは「許可を出す」じゃなくて「拒否ではない」だから
先に許可だしてても大丈夫らしい
251 : スペースNo.な-74  : 2010/02/28(日) 02:15:47
>>250
WEBマスターツールはGoogle弾いてると使えないからね
いっそ許可しちゃうか、きたロボ調べてその都度許可するかしてみて
自分でindex操作出来るんだから、絶対使った方がいい
252 : スペースNo.な-74  : 2010/03/06(土) 15:00:02
誘導されて来ました。わかる方いらっしゃったら、お答えお願い致します。

futomiの無料版を使っているのですが、ページに埋め込んであるタグ内のURL(アクセスしても何も見れない)に、
たまに75とか90とか、一時間以内に一人でアクセスされているログが残ります。
これはどういうことなのでしょうか。残ってるホスト名は普通に個人っぽいです。

他にも、16とか3とか、そのURLにアクセスしたというログが残ることも
珍しくないのですが、ウィルスソフトなどの関係なのでしょうか?

わかる方、いらっしゃったらお答えをお願い致します。
253 : 252  : 2010/03/06(土) 15:18:55
>>252です。調べてみましたら、アクセス解析では、はじく設定にしてある
私のIPアドレス(実際に、ページを開いても、通常のページではログが残っていない)が、
どうも>>252でお伝えしたページへの大量アクセス元と認識されているようです。
CGIの知識にも乏しく、恐れ多いですが、ご説明できる方、いらっしゃいましたら、
お願い致します、この通りです。
254 : スペースNo.な-74  : 2010/03/06(土) 22:04:43
今回の韓国国ぐるみの2ちゃんねるへの攻撃で
やっぱあの国駄目だわと再認識して
自分とこでも韓国向けの規制強化した
中国も
255 : スペースNo.な-74  : 2010/03/07(日) 02:23:16
>>253
futomi使ってないから75とか90の意味も理解出来てないんだけど
鯖の生ログ見られないの?
記述系のCGIなら、単にスパムにURL拾われちゃっただけに思えるけど

つか誘導って言われても同人関係ないし…
256 : スペースNo.な-74  : 2010/03/07(日) 02:42:08
>>255
構っちゃ駄目
257 : スペースNo.な-74  : 2010/03/12(金) 11:23:47
数分〜数時間に渡って同一ページに1〜4アクセス/1秒するhostをググったら、

「m9Project-割れ厨大百科」
download2ch.net/top/page/1680

とやらが引っかかったんだが、これはどういう意味なんだ…?
連続アクセスしてきたhostが割れ厨だということか?
Apachログを見る限り、スムーズに閲覧出来ている様子なんだが
何のためにやっているのか想像がつかない。
258 : ロボ  : 2010/03/14(日) 21:11:51
分かる方いたら教えてください。

.htaccessでロボット避けをしたいのですが
借りてるサーバーがhtaccessはLimitおよび"AuthConfig"しか許可されていません
ネットで調べたロボ避けの.htaccessを設置するとエラーになってしまいます
Limitおよび"AuthConfig"しか許可されていないとロボ避けは出来ないのでしょうか
もしくは、出来るとしたらどのように記述すればいいのか教えてください
宜しくお願いします
259 : スペースNo.な-74  : 2010/03/14(日) 22:33:42
>>258
どこか知らないけど、借りてる鯖のスレに行った方がいいと思う
癖のある鯖は.htaccessまとめがあったりするから
260 : スペースNo.な-74  : 2010/03/15(月) 00:03:31
あ、同じサーバ使ってるかも

思うに、258さんは.htaccess自体への知識がまず不足してるんじゃない?
かなり色々設定できるよ。このスレで危険視されてる物の情報をありがたくいただいて
片っ端から.htaccessに足してってる。
261 : スペースNo.な-74  : 2010/04/03(土) 20:35:35
favicon設置したら404が出なくなったっぽ
すっきりした
262 : スペースNo.な-74  : 2010/05/17(月) 22:58:24
ジャンルの雑談スレで「灰汁解みるとうちのサイトとつべの2窓してる
閲がいるんだけど…」ってレスがあったんだけど、閲覧者が別窓でどのサイト
見てるかわかるアク解ってあるの?
肝心のそのレス主は何人かどこの灰汁解って聞かれていたのに別の話題で
流されてしまってたんでずっと気になっています
263 : スペースNo.な-74  : 2010/05/17(月) 23:44:54
ブラウザのバグかなんかで、別タブのリファラが送られることがあるってのじゃない?
うちでもたまにそれっぽいリファラを見かける
264 : スペースNo.な-74  : 2010/05/20(木) 01:20:10
ICC-Crawler がしつこい!
265 : スペースNo.な-74  : 2010/05/20(木) 02:38:57
削除メール出しなよ
266 : スペースNo.な-74  : 2010/05/21(金) 05:27:03
ヤフーのサイトエクスプローラーが突然サイトを認証しなくなったー
同一のアカウントの中で一番上の階層だけ認証しない。
原因として出たからrobots.txtも消したし、.htaccessもエラーページを
自作のにするだけに使ってるだけなのに何故…
robots.txtだってヤフーのやつは許可する設定にしてあったのに原因として出るし訳分からん。
267 : スペースNo.な-74  : 2010/05/26(水) 23:43:49
ツイッターでサイトのURLを呟かれて困ってる。
呟いてる人は好意的に紹介してくれたみたいなんだけど
ジャンル柄検索に引っかかるとまずいんだ。

仕方がないからリファラで弾こうと思ったんだが、
ツイッターの呟きからのリンクはリファラ吐かない?らしく
NINJAのアク解だと「リンク元不詳」になる。

ツイッターからのアクセス拒否してる人いますか?
どうやったら上手く弾けるだろう?
268 : スペースNo.な-74  : 2010/05/26(水) 23:59:36
NINJAのアク解だけで判断したの?生ログではどうだった?
269 : スペースNo.な-74  : 2010/05/27(木) 00:04:19
>>267
ツイッター公式からだとリファラ出る
でもクライアント(Tweenとか)からだとリファラが出ないな…
270 : 267  : 2010/05/28(金) 14:25:49
>>268 , >>269
レスありがとう。
該当の呟きのリンクを自分でクリックしたとき(公式ウェブから)の生ログを
ダウンロードして確認してみたんだけど、リンク元が「"-"」になってた。
試しに、

SetEnvIf Referer "^https://twitter\.com" shutout

order Allow,Deny
Allow from all
Deny from env=shutout

を記述してみたけどアクセスできてしまった…
272 : スペースNo.な-74  : 2010/05/31(月) 12:47:32
マンドクセーからSetEnvIf Referer "twitter"この1語で全弾きおいしいです^q^
巻き添え?なにそれおいしいの
273 : スペースNo.な-74  : 2010/06/01(火) 03:27:00
生ログ確認したらリンク元が「"-"」ってことは
Referer出てないってことじゃない?
だったら>>270>>271みたいな記述をしても弾けないんじゃ?
275 : スペースNo.な-74  : 2010/06/02(水) 00:48:53
ウチのサバ生ログ取れないとこだけど
ぽけろぐでtwitterのリファラでるし、>>271の方法で弾ける
サバによって違うのかな?
277 : スペースNo.な-74  : 2010/06/04(金) 15:05:52
質問です。

indexとなるhtmlページにフォームを置いて、パスワードを入力。
SSL通信で、Basic認証で保護されているフォルダ内のサイトへ接続…
ということはできるのでしょうか。.htaccessもSSLもできるサーバーです。
要は、basic認証のダイアログを出したくないのですが…

アクセス制限を.htaccessで行い、パスワード認証をCGIなりPHPでやると安全性は下がりますか?
Ajaxで橋渡しとかになるんでしょうか、古いブラウザや携帯だとダメなんじゃないかと心配です。
279 : スペースNo.な-74  : 2010/06/04(金) 18:57:11
>278
ありがとうございます。とても勉強になりました。
ブラウザシェアの記事によるとIE7な方も多いので、
そのままでは難しいかもしれませんね…残念。
その記事の中にあった、mod_auth_formについて調べてみます。

フォームログインの同人PCサイトも、Basic認証してると思い込んでました…
mixiとか、携帯同人サイトでよく見るパスワード制って、どうなってるんでしょうか?
(スレチなら移動します)
283 : スペースNo.な-74  : 2010/06/06(日) 16:52:09
>>282
ストーカー
285 : スペースNo.な-74  : 2010/06/11(金) 18:47:20
火狐のアドオンとかUA偽装できるダウンローダが鬱陶しい
UAで弾けないならとメソッドのHEADを弾くことにした
それでも弾けないものもあるけどかなりすっきりした
286 : スペースNo.な-74  : 2010/06/23(水) 08:57:33
あらくもでサイトやられた\(^o^)/
悪意を持って使ったとしか思えない攻撃性
みんな気をつけて


あとNEVER翻訳でごっそりサイトが翻訳されていた
小説サイトなのでわざわざ翻訳して読んでくれたなら有り難いが
正直怖い
効果無いとは思うが注意書きふやそ
287 : スペースNo.な-74  : 2010/06/28(月) 23:30:53
>>286
小説サイトを翻訳にかけるって、そりゃ頑張って読んでくれたんだよ

自分も自ジャンルがあまりにマイナー作品だったから
必死にフランスや台湾のサイト探して翻訳して読んだことがある
288 : スペースNo.な-74  : 2010/07/07(水) 10:10:21
>>287
自分もNEVERで来られたので試してみた

1.自作(日本語)
2.エキサイトで日本語からハングルへ翻訳
3.更にハングルから日本語へ翻訳

崩壊していた
自分の文章じゃない以前に日本語として崩壊していた
更に自ジャンルにはジャンル特有の造語が出てくるので、
その部分が変に翻訳されてたりでもうめちゃくちゃだった
2の段階で、ハングル読める友達に見てもらったけど、
「1の雰囲気は何となく残っているけど別物」だそうだ
289 : スペースNo.な-74  : 2010/07/07(水) 23:02:29
英語苦手だが海外スラッシュを翻訳かけてなんとなく読んで満足していた私が言う
翻訳サイトは文章の大筋がなんとなーくわかるだけでいいんだよ
変な訳とかは脳内で補完できるから