📢 お知らせ
  • Twitterで話題の技術論文ランキング

    ツイッターで話題・人気の技術論文をランキング形式で集めたまとめです。

  •   

  • 並び替え:
    件数  : 137件
    更新日 : 2021年10月23日 22時02分
  • [PR]

  • ZOZOとのお仕事がAI・機械学習のトップ国際会議NeurIPSに受理されました。ZOZOTOWN上の数千万件のファッションおすすめデータと、おすすめアルゴリズムを作るための開発基盤を無料公開。米中の覇権にちょっと抗って、日本発の開かれた技術とデータの開発をっていうノリです

  • 1212 RT

    成田 悠輔

    成田 悠輔 @narita_yusuke

    2021/10/15 12:04:24

    ZOZOとのお仕事がAI・機械学習のトップ国際会議NeurIPSに受理されました。ZOZOTOWN上の数千万件のファッションおすすめデータと、おすすめアルゴリズムを作るための開発基盤を無料公開。米中の覇権にちょっと抗って、日本発の開かれた技術とデータの開発をっていうノリです

    https://bit.ly/3vckCcu

    ZOZOとのお仕事がAI・機械学習のトップ国際会議NeurIPSに受理されました。ZOZOTOWN上の数千万件のファッションおすすめデータと、おすすめアルゴリズムを作るための開発基盤を無料公開。米中の覇権にちょっと抗って、日本発の開かれた技術とデータの開発をっていうノリです

    このツイートをシェアする

  • 汎用言語モデル「T0」は110億個のパラメータにもかかわらず、11個中9個のデータセットでGPT-3(16倍大きいモデル)と同等以上の性能。またBIG-BenchではT0より6倍大きなモデルを14個中13個のタスクで凌駕 25以上の組織から40人以上の研究者や技術者などが集まって研究してる

  • 233 RT

    汎用言語モデル「T0」は110億個のパラメータにもかかわらず、11個中9個のデータセットでGPT-3(16倍大きいモデル)と同等以上の性能。またBIG-BenchではT0より6倍大きなモデルを14個中13個のタスクで凌駕

    25以上の組織から40人以上の研究者や技術者などが集まって研究してる


    https://arxiv.org/abs/2110.08207

    汎用言語モデル「T0」は110億個のパラメータにもかかわらず、11個中9個のデータセットでGPT-3(16倍大きいモデル)と同等以上の性能。またBIG-BenchではT0より6倍大きなモデルを14個中13個のタスクで凌駕25以上の組織から40人以上の研究者や技術者などが集まって研究してる
    汎用言語モデル「T0」は110億個のパラメータにもかかわらず、11個中9個のデータセットでGPT-3(16倍大きいモデル)と同等以上の性能。またBIG-BenchではT0より6倍大きなモデルを14個中13個のタスクで凌駕25以上の組織から40人以上の研究者や技術者などが集まって研究してる
    汎用言語モデル「T0」は110億個のパラメータにもかかわらず、11個中9個のデータセットでGPT-3(16倍大きいモデル)と同等以上の性能。またBIG-BenchではT0より6倍大きなモデルを14個中13個のタスクで凌駕25以上の組織から40人以上の研究者や技術者などが集まって研究してる
    汎用言語モデル「T0」は110億個のパラメータにもかかわらず、11個中9個のデータセットでGPT-3(16倍大きいモデル)と同等以上の性能。またBIG-BenchではT0より6倍大きなモデルを14個中13個のタスクで凌駕25以上の組織から40人以上の研究者や技術者などが集まって研究してる

    このツイートをシェアする

  • @cometscome_phys 伊藤さん(というより谷崎さん)が指摘の様に もそうですが、exponents(今回のはν=2/3と主張)が明らかに矛盾しているので、今回のは没で良いのでは?

  • 328 RT

    早川尚男

    早川尚男 @hhayakawa

    2021/10/22 13:18:49

    @cometscome_phys 伊藤さん(というより谷崎さん)が指摘の様に

    もそうですが、exponents(今回のはν=2/3と主張)が明らかに矛盾しているので、今回のは没で良いのでは?

    https://arxiv.org/abs/2007.14315

    このツイートをシェアする

  • [PR]

  • VAEで潜在表現のdisentangleな表現を学習することができるCausalVAEを提案。潜在層に学習パラメータAを設け、潜在変数同士の因果関係を学習させる。Aを三角行列にすることで、潜在変数を再現するような制約をかける。Toy ModelやCelebAで要素が分離できていることを確認。

  • 424 RT

    akira

    akira @AkiraTOSEI

    2021/10/16 10:24:11


    VAEで潜在表現のdisentangleな表現を学習することができるCausalVAEを提案。潜在層に学習パラメータAを設け、潜在変数同士の因果関係を学習させる。Aを三角行列にすることで、潜在変数を再現するような制約をかける。Toy ModelやCelebAで要素が分離できていることを確認。

    https://arxiv.org/abs/2004.08697

    VAEで潜在表現のdisentangleな表現を学習することができるCausalVAEを提案。潜在層に学習パラメータAを設け、潜在変数同士の因果関係を学習させる。Aを三角行列にすることで、潜在変数を再現するような制約をかける。Toy ModelやCelebAで要素が分離できていることを確認。

    このツイートをシェアする

  • 3次元イジングモデルの厳密解・・・たしかに自由エネルギーの最終的な数式と臨界温度が書いてありました・・・。ただそこに至る論証の正否は私には判定できません・・・

  • 523 RT

    TANIMURA Shogo

    TANIMURA Shogo @tani6s

    2021/10/22 12:48:28

    3次元イジングモデルの厳密解・・・たしかに自由エネルギーの最終的な数式と臨界温度が書いてありました・・・。ただそこに至る論証の正否は私には判定できません・・・


    https://arxiv.org/abs/2110.11233

    このツイートをシェアする

  • 新しいプレプリントを公開しました: 超伝導体に電流を流すとトポロジカル相転移が生じうることを明らかにしました。これにより、電流を流すだけでトポロジカル超伝導を実現(スイッチ)できる可能性があります。ご興味のある方は是非ご覧ください。以下内容について連ツイ。

  • 621 RT

    新しいプレプリントを公開しました:
    超伝導体に電流を流すとトポロジカル相転移が生じうることを明らかにしました。これにより、電流を流すだけでトポロジカル超伝導を実現(スイッチ)できる可能性があります。ご興味のある方は是非ご覧ください。以下内容について連ツイ。

    https://arxiv.org/abs/2110.06959

    このツイートをシェアする

  • NVIDIAとETH(スイス連邦工科大学チューリッヒ校)のAI研究 犬型ロボ「ANYmal」が平坦な場所で4分以内に歩くことを学習。平坦じゃない場合は20分以内。人の赤ちゃんは生後8ヶ月前後(約86,400分)でハイハイを開始し、犬は生後3週間(30,240分)頃に四足歩行を始めるそうだが

  • 721 RT

    NVIDIAとETH(スイス連邦工科大学チューリッヒ校)のAI研究

    犬型ロボ「ANYmal」が平坦な場所で4分以内に歩くことを学習。平坦じゃない場合は20分以内。人の赤ちゃんは生後8ヶ月前後(約86,400分)でハイハイを開始し、犬は生後3週間(30,240分)頃に四足歩行を始めるそうだが


    https://arxiv.org/abs/2109.11978

    NVIDIAとETH(スイス連邦工科大学チューリッヒ校)のAI研究犬型ロボ「ANYmal」が平坦な場所で4分以内に歩くことを学習。平坦じゃない場合は20分以内。人の赤ちゃんは生後8ヶ月前後(約86,400分)でハイハイを開始し、犬は生後3週間(30,240分)頃に四足歩行を始めるそうだが
    NVIDIAとETH(スイス連邦工科大学チューリッヒ校)のAI研究犬型ロボ「ANYmal」が平坦な場所で4分以内に歩くことを学習。平坦じゃない場合は20分以内。人の赤ちゃんは生後8ヶ月前後(約86,400分)でハイハイを開始し、犬は生後3週間(30,240分)頃に四足歩行を始めるそうだが

    このツイートをシェアする

  • [PR]

  • 言語モデル(GPT-3)のみを使って教師無し機械翻訳のSOTA性能を達成。1) 指示によるZero-shotで翻訳文を生成 2) 生成された翻訳対でプロンプトを作り翻訳文を生成 3) 生成された翻訳対でfine tuning 4) できたモデルで翻訳を作り、逆向きもfine tuning(back translation)

  • 820 RT

    Daisuke Okanohara

    Daisuke Okanohara @hillbig

    2021/10/18 07:54:08

    言語モデル(GPT-3)のみを使って教師無し機械翻訳のSOTA性能を達成。1) 指示によるZero-shotで翻訳文を生成 2) 生成された翻訳対でプロンプトを作り翻訳文を生成 3) 生成された翻訳対でfine tuning 4) できたモデルで翻訳を作り、逆向きもfine tuning(back translation)

    https://arxiv.org/abs/2110.05448

    このツイートをシェアする

  • 数学関数の計算コストと精度のトレードオフがちゃんと書いてあっておもしろい

  • 920 RT

    るふぁ

    るふぁ @lpha_z

    2021/10/19 09:31:14

    数学関数の計算コストと精度のトレードオフがちゃんと書いてあっておもしろい


    https://arxiv.org/abs/2107.05761

    このツイートをシェアする

  • モバイル用の高速ネットワークをTransformerとCNNを組み合わせたMobileViTを提案。まずCNNで局所情報を取り込んだ後にTransformerで大域情報を処理する機構になっている。MobileNetv3より5.7%精度が高い。分類、物体検知、セグメンテーションで使える。

  • 1020 RT

    akira

    akira @AkiraTOSEI

    2021/10/21 19:30:00


    モバイル用の高速ネットワークをTransformerとCNNを組み合わせたMobileViTを提案。まずCNNで局所情報を取り込んだ後にTransformerで大域情報を処理する機構になっている。MobileNetv3より5.7%精度が高い。分類、物体検知、セグメンテーションで使える。

    https://arxiv.org/abs/2110.02178

    モバイル用の高速ネットワークをTransformerとCNNを組み合わせたMobileViTを提案。まずCNNで局所情報を取り込んだ後にTransformerで大域情報を処理する機構になっている。MobileNetv3より5.7%精度が高い。分類、物体検知、セグメンテーションで使える。

    このツイートをシェアする

📢 他にも以下のサービスを運営しています