Twitter: @atene_gakudo+TAKAGI-1のはてなブックマーク
全体案内 > 「知的ネット社会」案内ページ ><<2024/05/07 <2024/05/28 || 2024/06/11> 2024/07/02>>
2024/06/04
|
Googleのサーチアルゴリズムが漏洩。
さすがにこの規模のリークは歴史上、初めてのことだと記憶しています。
そして、Google自身は否定していたもののSEO業界では長年疑われていたアルゴリズムの数々が実在していたことも明らかになりました。
2,596個のモジュール、計14,014個のランキング特徴量。
以下、主なものを解説していきます。
1. ドメイン権威
Googleの公式見解は「我々はドメイン権威のようなものは持っていない」というものだったが、siteAuthorityというfeatureの存在が確認された。
2. クリック
これもGoogleの公式見解と異なり、GlueやNavBoostというランキングシステムにより、クリック情報が検索ランクに影響を与えていることが明らかになった。NavBoostは2005年から存在していて、過去18ヶ月のクリックデータを元にしている。
3. ホスト年齢
hostAgeというフィーチャーの存在によって、生まれたばかりの新しいサイトはやはりサンドボックスに閉じ込められていることが明らかに。hostAgeという言葉自体がhost + ageの合成語だけでなく、一単語で「人質・担保」という意味を持つので言葉遊びですね。
4. Chromeのデータ
Chromeの利用データはサーチに影響しないという公式見解をよそに、やはりChromeのデータは使われていた。使わないわけがないので否定すること自体が公式見解の信憑性を損ねていたと思います。
5. アーキテクチャ
Googleのランキングシステムは単体の巨大なアルゴリズムではなくマイクロサービスの集合体。Trawler (クロール) / Alexandria (インデックス) / Mustang (ランキング) / SuperRoot (クエリー処理) などからなる。
6. リランカー
これに加えて、NavBoost / QualityBoost / RealTimeBoostなどのブースターでSERPの一等地に何を表示させるかを競い合わせている。中でもNavBoostは出現率が高く強力な様子。
7. Pandaアルゴリズム
Amit SinghalがリードしたPandaは、ユーザー行動や外部リンクなどに基づいてランクのスコアを調整する。特許にもなっている。ドメイン、サブドメイン、パスなどの多レベルで適用される。オブザーバビリティを担保するため、あえて機械学習を使ってないという点が印象的。
8. author属性
Google公式のE-E-A-T推奨通り、author属性は特徴量になっていた。ほとんどのサイトやフィードでauthor系メタデータはちゃんと入力されていないケースが多いが、これは対応したほうが良いかもしれない。
9. 降格
リンク先のコンテンツとのミスマッチ、SERPにおけるユーザー行動、UXの不備、検索ワードとドメイン名が完全一致する場合、製品レビュー系コンテンツ、グローバルページ、ポルノ、などは降格される。
10. リンクグラフはまだまだ重要
sourceTypeなどのメトリックによりリンクの重みが変わる。インデックス・ティアに分けられ、重要度高・更新頻度高・アクセス頻度高のコンテンツはより高速なフラッシュメモリに保存され、ティアの低いインデックスはハードディスクに保存される。
11. リンクスパムはベロシティ・シグナル重視
スパムは短期間に大量投下されたもののスパイクを検出することを特に重視している。怪しいものを見つけたら現在のベースラインと比較して異常値を検出。
12. 最新20件のページ更新履歴を保持
インデックスされたページの評価が高まってから変更して別のコンテンツに誘導するなどのハックを防ぐために過去20件の変更履歴を保持していることが判明。逆にいうと最大20件とバレてしまったので狙われそう…
13. ショートコンテンツの独創性を評価
Twitterのようなショートコンテンツでは、OriginalContentScoreにより、文字数をカウントし、オリジナリティを評価。
14. 日付は重要
鮮度は重要。bylineDate / syntacticDate / semanticDateなどにより、コンテンツの正確な日時情報を様々な角度から抽出している。
15. ビデオサイトは別扱い
もし50%以上のページがビデオならビデオサイトとして扱う
16. Your Money Your Life (YMYL) も特別扱い
公式情報通り、お金や健康など人生にクリティカルな影響を与える情報はより厳格に扱われる。
17. ゴールドスタンダードはある
goldenというフィーチャーで人間あるいはAIにラベルされたコンテンツは実在する。 https://www.paulgraham.com/articles.html とかかな笑
18. Embeddingによるトピックチェック
ページのコンテンツがサイトの趣旨に沿ったものであるかどうかをembeddingでチェックしている。これで、サイトにあると違和感を感じるような内容かどうかをチェック。
19. 零細個人サイトは特別扱い?
smallPersonalSiteというフィーチャーで、資金力にものを言わせることができない個人サイトは公平のためブーストしている様子。
というわけで、これまで謎だったGoogle検索エンジンの様々な側面が今回初めて公にリークされたので、可能な範囲で解説してみました。興味がある方は、以下のリンクの原文を当たってみてください。
SEO業界はざわつきそうですね。
https://ipullrank.com/google-algo-leak
posted at 12:53:15
元ネタはこちら
https://ipullrank.com/google-algo-leak
posted at 12:53:17
JAXAとヨーロッパ宇宙機関(ESA)が共同で開発した、雲や空気中の粒子(エアロゾル)を観測する地球観測衛星「EarthCARE(アースケア)」が明日の朝7時20分、アメリカから打ち上げ予定です!
朝起きたら、眠気覚ましに衛星打上げ見ませんか? https://twitter.com/jaxa_jp/status/1795290587589144969
posted at 12:53:39
@Michiaaaaaa 明確な根拠はありませんが、摂動(上流に乱数)を与えてみるとか、いかがでしょう。
posted at 07:16:27
探せ。電気工学の全てをそこに置いてきた。 https://twitter.com/NeutRaL_92116/status/1795570226198966324/photo/1
posted at 08:08:18
https://diamond.jp/articles/-/344186
>すべての体験は「独自」で「特別」です。その個別性を無視して、「わかるわかる!」と一般化して、理解したふりをするのは傾聴ではありません。相手の体験・経験には個別性があることを認識することこそが、相手をリスペクトすること
posted at 12:43:01
6月19日発売のハヤカワ新書『サイバースペースの地政学』著者の小泉悠さん、小宮山功一朗さんによる出版記念トークイベントを7/2(火)に渋谷の東京カルチャーカルチャーで開催決定!
https://tokyocultureculture.com/event/general/35545
posted at 12:44:47
数学苦手な文系出身の人には、ChatGPTに関西弁で問題の解き方教えてもらうといいよって勧めてる
関西弁は強い~読んでるだけで笑っちゃう? https://twitter.com/kawauSOgood/status/1795843413901976045/photo/1
posted at 12:46:09
昨日の大雨から一転、今日は快晴です?
大雨の後に鴨川デルタに来ると、全く水の色が違う賀茂川と高野川の合流が見れます。 https://twitter.com/nobo_kyoto/status/1795664232601780567/photo/1
posted at 12:52:52
新人さんからのご指摘がなかなか初々しくてよい。
新『なんでPLC、ラダーなんて使うんですか?PCで言語ごりごりじゃだめなんすか?』
なんて答えたらいいですかね…
・耐久性
・ラダーは文化的なもの(ST使える人が少ない)
他なにかあります…?汗
新人さんコメントでシリーズ化できそう笑
posted at 12:54:50
@kamgraclatz これは私も思っていた。IF文を組み合せたら書けるじゃん、って。
posted at 12:58:07
人工知能学会二日目。情報学研究所の相澤先生の講演はためになった。「大規模言語モデルの登場で、断片化していた諸学問に統合化の方向が見られる」という御指摘はなるほどと思う。これを、言語研究者の立場から捉え直すと、言語研究の分野の超拡大という昨日書いた実感に繋がると思う。
posted at 12:58:33
#ROBOMECH2024、強化学習で獲得した歩様での階段走破のデモをしてます! https://twitter.com/ystk_hara/status/1796015677947703540/video/1
posted at 19:55:02
https://president.jp/articles/-/82122?page=3
>「問う」を発する際、重要なのは人に考えさせること。その点が幸之助のコミュニケーションの特徴で、その問いは、経営の本質を突くものがほとんどであった。
posted at 03:03:52
めちゃくちゃ良記事。不偏性と一致性の理解が一気にクリアになった。 https://twitter.com/tsukapontan_/status/1795879821781979580/photo/1
posted at 03:07:27
これはジワジワ来るな??? https://twitter.com/nzdewchexus/status/1795974143835246863/photo/1 https://twitter.com/HayanoMotoshi/status/1795972485550141740
posted at 03:44:25
Miss. Zhang→ Dr. Zhang
#PhDone https://twitter.com/QianxueZhang/status/1795814977959346639/photo/1
posted at 08:08:00
【計画判明】関門海峡またぐ2本目の橋、「明石海峡大橋」以来30年ぶりのビッグプロジェクト
https://news.livedoor.com/article/detail/26502753/
海中に2本の主塔を建てて巨大なつり橋を整備。主塔間の長さを示す支間長は1キロを超える規模に。新しい橋は海面からの高さが約60m、主塔の高さは200m近くになる見通しだという。 https://twitter.com/livedoornews/status/1795969143033786408/photo/1
posted at 08:08:23
ミニ脳16個入「バイオプロセッサ」 消費電力通常の100万分の1、APIでアクセス可能、研究者向けサブスクも?https://levtech.jp/media/article/column/detail_448/ ヒト脳オルガノイド16個と電極32を接続したプロセッサ。月500ドルでこれに遠隔からPythonで電気刺激を与え神経活動を記録等できる。新鮮な培地入替は毎日してくれる。 https://twitter.com/shiropen2/status/1796334623808753838/photo/1
posted at 12:47:12
素朴な疑問なんだけど、関東平野の学校の校歌に含まれる地理的ランドマークって何なんですか?山とかないところはどうしてるんだろう
posted at 12:58:44
文章ではなく、文章を書いた人に当たれ。 *o
posted at 08:21:33
枠を設定しない。 *o
posted at 08:30:31
国土数値情報に「大規模盛土造成地」と「高速バス停留所」が新しく増えてる! https://twitter.com/ra0kley/status/1796533470568853576/photo/1
posted at 08:45:54
管理によって、組合せが可能になり、弾力的になる。 *o
posted at 09:00:52
Informal - Formal https://twitter.com/knowiiedges/status/1796432491513086205/photo/1
posted at 09:01:32
有機化学とはあんまし関係ないけど、理系なら知っておきたい「らせん」の知識をまとめたよ。三次元的なバネみたいな奴は「螺旋(Helix)」と呼ばれ、二次元的な渦巻きみたいな奴は「螺線(Spiral)」と呼ばれるんだけど、日本語の漢字もちょっと違うよ。 https://twitter.com/sinOrganicChem/status/1796465344992903449/photo/1
posted at 09:02:47
Informal - Formal https://twitter.com/knowiiedges/status/1796432218489024800/photo/1
posted at 09:24:58
Informal vs Formal https://twitter.com/knowiiedges/status/1795902376651747648/photo/1
posted at 09:25:17
「環境のよさ」を、ある領域に存在することにより発生する損失の少なさ だと考える。
posted at 09:25:49
自分が間違えても、大丈夫なようにしておく。つまり、自分の誤りに他者が気づき、他者が誤りを指摘できるようにしておくこと。 *o
posted at 09:33:23
調整に時間をかけないような仕組みにする。 *b
posted at 09:33:34
趣味で「感情ちゃん」ってソフト作ったからフォロワー見て~ https://twitter.com/sald_ra/status/1796543902536900789/video/1
posted at 09:59:06
@fladdict これ使いました!
https://huggingface.co/Mizuiro-sakura/luke-japanese-large-sentiment-analysis-wrime
posted at 09:59:15
乱流のレビュー論文がようやく出版になりました。軽い気持ちで引き受けましたが、書き始めたら長りました。皆さん、眺めて下さい。
https://doi.org/10.1007/s41614-024-00161-8
図1にエネルギースペクトルを示しましたが、乱流のDNSの到達点がよく分かります。全体まとめてみて、自分自身でもかなり勉強になりました。
posted at 15:40:47
第2関門橋(下関北九州道路)のつり橋の主塔間の長さは約1500m。これは明石海峡大橋の1991mに次ぐ国内2位の規模。主塔の高さ200m以上、海面から橋までの高さは約60m
阪神高速湾岸線の世界最大級の連続斜張橋に続き、令和の時代にこれほどの土木建築が見られるのは嬉しい。どちらも必要な公共事業です https://twitter.com/OSAPCO1/status/1796719494494327127/photo/1
posted at 15:41:58
Webサイトを復旧しました。
無窮ナレッジ 電子書架
https://takagi1.net/books/
posted at 18:30:02
現在の Amzon の商品画像のURLは、
https://images-na.ssl-images-amazon.com/images/P/【asin】.09.LZZZZZZZ.jpg (LZ...は画像サイズを表す)
posted at 18:31:27
大臣。先の戦争では、旧日本軍の希望的観測、机上の空論、こうあって欲しいという発想等にしがみついたが為に、国民に300万人以上もの犠牲者が出ています。根拠のない楽観は禁物です ---『シン・ゴジラ』(2016)
posted at 19:15:45
制限ある環境において努力することは、効果がある。
しかし、自由度が高い環境においては、努力しないで済む方法を見つけることに努力することの効果が大きい。 *b
posted at 09:33:19
@knightma310 発売時、「街中でヘッドホンしながら音楽を楽しむ」というカルチャーを根付かせるために、当時は社員でこぞってウォークマンして街に出たそうです。
昔の上司が酒の席で語ってました。
新たな価値観を生み出すって、地道な努力があってこそなんです。
posted at 07:20:28
陸上から水中へドボン
これこれこれがやりたかったのよ https://twitter.com/kazune3069/status/1797301358409945505/video/1
posted at 19:33:14
On & In https://twitter.com/knowiiedges/status/1797160025624039933/photo/1
posted at 20:31:39
本日から国際学会@奈良です。
能舞台で発表がなされます。 https://twitter.com/WAKABAYASHITak1/status/1797780587429917051/photo/1
posted at 12:33:51