記事: Blueskyの構成可能なモデレーション

Protocol/AT Protocol
概要

2023-04-13にBluesky公式記事「Composable Moderation – Bluesky」が投稿されたので紹介します。以下の投稿で認知しました。

avatar
ぐぬ管 (GNU social JP管理人)|gnusocialjp@gnusocial.jp
!sns blueskyの公式の新しい記事。モデレーションとアルゴリズムの話のようです。 https://twitter.com/bluesky/status/1646676663965745152?t=j3KhXj4FlWaqJBqscfRjOw&s=09

モデレーション機能の話のようです。記事の内容を翻訳しながら一部まとめて紹介します。

導入

モデレーションはSNSに必要な機能です。ユーザーの安全優先のため、党書プライベートβ版で招待制にしていました。公開連の開始の前にモデレーション機能を完成させているところです。

記事: Blueskyのアルゴリズムの選択 | GNU social JP」で紹介したアルゴリズムの選択と同様に、モデレーション機能もAT Protocolのサードパーティープロバイダーの参加を可能にするアプローチです。つまり、モデレーションも構成可能で、カスタマイズ可能にします。カスタムフィードが、デフォルト (フォロイーのみ) と、カスタムアルゴリズムの選択肢があるように、モデレーションも、デフォルトとカスタムフィルターが用意される形式になります。

モデレーションの具体的な内容自体は十分確立されたものなっています。つまり、集中型SNSのように、自動ラベル付けを行い、多くの分散型SNSのように管理者決定を行います。AT Protocolで面白いのは、開発者とユーザーの両方が参加可能なラベリングシステムになっているところです。内部では、集中型のSNSのラベリングを使用してモデレーションを実装しており、これを分離してサードパーティーが参加できるようにしたいと考えています。

ラベリングシステム

具体的な設計方法は以下となります。

  • 誰でもラベルを定義して、コンテンツやアカウントに適用可能 (例: spam、NSFW)。これは別サービスのためPDSやクライアントアプリで行う必要はない。
  • ラベルは自動生成または手動生成が可能。
  • ネットワーク内の任意のサービスまたは個人がこれらのラベルを使用してUXを決定。

これをBlueskyアプリで適用していきます。具体的には、以下の流れになります。

  1. 一般的な自動フィルタリングで、違法なコンテンツを削除し、不快なコンテンツにラベルを付ける。
  2. サーバー単位のフィルターをbsky.socialの管理者として適用し、既定の設定とカスタム制御で、コンテンツを非表示、警告、表示できるようにする。
  3. ユーザーが最後に自分でコンテンツやアカウントを除外できるラベルの追加セットを購読。

イメージとしては、集中型は最高裁判所での紛争解決に似ています。連合型だと州政府レベルで紛争解決に似ており、気に入らない場合、他の州に移転できます。

サーバーの切替など、通常移転は困難で費用がかかりますが、AT ProtocolではPDSでサーバーの切替を容易にし、モデレーションを独立させることで改善しています。

コミュニティーラベリング

さらに、オンラインコミュニティーのモデレーションシステムに参加することで、自分の所属サーバーのモデレーションに依存しない、「コミュニティーラベリング」というのも考えています。

コミュニティーラベリングは、自動や手動でも構成できます。人が作詞したラベルは、ミュート・ブロックリストに似たようなものです。

手動のコミュニティーラベリングシステムは以下のように考えています。

  • 誰でもラベルセットを作成し、そのラベルセットの管理者またはモデレーター (mod) を追加可能。
  • modはラベルをアカウントやコンテンツに追加可能 (失礼、荒らしなど)。
  • 誰でもこのラベルセットを購読して、自分のUXにラベルを適用可能。
予定

記事公開日にアプリでの自動フィルタリング機能を公開し、ユーザーフィードバックに基づいて改善します。コミュニティーラベリングは進行中で、詳細を近日中に公開します。

このモデレーションシステムで、ユーザーの安全を優先すると同時に、ユーザーが多くの制御を可能にするように目指しています。

実際にiOSアプリでは以下のようにフィルター機能が追加されていました。

公式Webアプリにも [Settings]-[Advanced]-[Content moderation] が追加されており、以下の選択肢が表示されていました。

[Sexual Content]/[Violent/Bloody]/[Political Hate-Groups]/[Spam]/[Impersonation] のフィルター項目でした。どういう基準になっているのかは不明です。ひとまず、全部 [Warning] にして何が引っかかるのか見ようと思います。

結論

Blueskyのモデレーション機能でした。

モデレーション機能というよりかは、フィルター機能、ミュートリスト、ブロックリストの共有のようなものに感じました。読了後の感想は以下です。

avatar
ぐぬ管 (GNU social JP管理人)|gnusocialjp@gnusocial.jp
replying to ぐぬ管 (GNU social JP管理人)|gnusocialjp@gnusocial.jp
先日のblueskyの公式ブログのモデレーションの記事を読んでいます。 内容がfediblockに近くて、あまりいい印象ありませんよ。ブロックリスト、ミュートリストを共有するようなもの。 これを恐ろしいと思うかどうかは立場次第です。
ぐぬ管 (GNU social JP管理人) (gnusocialjp@gnusocial.jp)'s status on Friday, 14-Apr-2023 10:12:52 JST - GNU social JP
!sns blueskyの公式の新しい記事。モデレーションとアルゴリズムの話のようです。
avatar
ぐぬ管 (GNU social JP管理人)|gnusocialjp@gnusocial.jp
replying to ぐぬ管 (GNU social JP管理人)|gnusocialjp@gnusocial.jp
!sns !politics 私の印象だと、Jack DorseyもBlueskyチームも基本的に左派に思います。Twitterが左派に支配されたことからもわかりますよね? 安全重視というのもそうです。Mastodonと基本的なスタンスは似ています。前から感じていましたけどね。

既に、Fediblockというドメインブロックのリストを共有する動きが過去にありました。それに近いものを感じ、私は恐怖を感じました。なぜ怖くなったかというと、これは検閲にもつながる話だからです。特定ユーザーをミュート、ドメインブロックのラベルに登録して皆で購読を斡旋するような、いじめ、嫌がらせのようなことも可能です。

このモデレーション機能で先日発生した「保安: Pawooの性器アバタースパムbotによるファボ爆テロ | GNU social JP」のようなテロに対応できるのか、モデレーションの透明性の話がありましたけど、はたしてどうなるのか、動向を見守ります。

コメント

Copied title and URL