Twitch. Some see it as a fun online community of gamers and good-natured e-sports fandom. For others, itโ€™s a perilous stream of potentially toxic content and hate speech.

In the ever-evolving landscape of digital communication, the real-time nature of messages on live-stream platforms like Twitch and YouTube Live brings with it unique challenges for content moderation. At present, effective tools for moderating content in live streams are lacking because existing models have been trained on non-real-time social media platforms like Facebook or Twitter. Research Assistant Dong-Ho Lee and Principal Scientist Jay Pujara, both from USC Viterbiโ€™s Information Sciences Institute (ISI), set out to change that. They have developed an innovative method that boosts the performance of moderation models on live platforms by 35%.

Pujara said, โ€œIf I post something on Twitter or Reddit, someone might respond hours or days later. But if weโ€™re looking at Twitch, itโ€™s a very different environment. People are sending messages every second.โ€

It all comes down to timing. Twitter, Facebook, and Reddit are asynchronous โ€“ where users post their thoughts, but the responses are not immediate. On the other hand, Twitch, YouTube Live, and other live-streaming platforms are synchronous โ€“ which is the equivalent of being in a live conversation.


For the ornithologically inclined or the nerd who loves owlish humor, this T-shirt knows whoooo makes science fun! The comfy premium tee is ideal for hitting the books or the lab, going on nature walks to birdwatch, or just making your fellow owl and science fans smile. Hoot hoot – time to fly to the top of the class armed with curiosity and wordplay!

In conversations on asynchronous platforms, thoughts are typically grouped into a structure of threads that allow for conversational context. And users have no time constraints, so they can comment with better thought-out responses. Whereas on synchronous platforms, thoughts are presented in real time, consecutively, with no structure to indicate context. The fast-paced nature encourages quick responses and multiple short comments. 

A First-of-Its-Kind Approach 

Seeing this gap in the research, Lee and Pujara conducted the first NLP study of detecting norm violations in live-stream chat.

โ€œNorm violationsโ€ refer to instances where users on online platforms breach the established rules or guidelines for acceptable behavior. Pujara explained, โ€œTypically there will be a set of rules that are published when you join [a live stream], and there are moderators who are trying to figure out if people are breaking these rules. Are you harassing someone? Are you trying to change the topic? Are you sending spam messages?โ€

The team of authors, including ISI Ph.D. students Justin Cho and Woojeong Jin, and Jonathan May, a research associate professor at the USC Viterbi Thomas Lord Department of Computer Science, used a dataset of 4,583 norm-violating comments on Twitch that were moderated by human channel moderators. 

โ€œThey gathered chat rules of each Twitch streamer, held iterative meetings to categorize types of norm violations, and managed annotators in labeling various live streaming sessions to analyze norm violations in Twitch,โ€ said Lee, who continued, โ€œThis involved a significant joint effort between various industry partners and academic institutions for the first study of norm violations in live-stream chat.โ€

Bring in the Humansโ€ฆ and the Details 

Pujara said, โ€œAn interesting thing about the way we did this is that, to get the label for the data, we crowdsourced. We had humans label it and then those humans would basically get three levels of detail. So, we were giving them progressively more information to be able to evaluate whatโ€™s going on.โ€ 

What kind of details were provided? The team designed a process that would determine the impact of varying levels of context surrounding the moderated comment. For example, did the chat history have an impact โ€“ either the commenterโ€™s last message before the moderated content or the broader chat around the time of the moderated comment? What was happening on the video as the comment was posted? And was there any external knowledge related to the content that is specific to the comment (i.e., particular emojis or slang within the channel). 

Context Is Crucial 

Turns out, when it comes to moderating live streams, context counts. 

Pujara explains their findings: โ€œYou can improve the quality of the moderation by using different amounts of information. And so, if youโ€™re designing an automated moderation system for Twitch, you really need to think about what the right context is to interpret what people are saying.โ€ 

The team used this information, identified the informational context that best helped the human moderators, and trained models to identify norm-violations by leveraging this contextual information.  Their results showed that contextual information can boost model moderation performance by 35%. 


Sign up for the Daily Dose Newsletter and get the morning’s best science news from around the web delivered straight to your inbox? It’s easy like Sunday morning.

Processingโ€ฆ
Success! You're on the list.

DAILY DOSE: Trump Replaces Casey Means With Fox News Doctor as Surgeon General Pick; Hidden Piece of Pangaea Revealed Beneath Appalachia.
Trump replaces surgeon general nominee amid vaccine concerns and criticism.
Climate change a global threat to brain health, stroke experts say
Climate change increases stroke risks through extreme weather, with efforts needed to …
Snow cover on Greek mountains has more than halved in four decades, study finds
A study reveals that snow cover in Greece's mountains has decreased by …
UN Women report finds online violence and deepfakes drive women from public life
A report reveals increasing online violence against women, worsening mental health and …

One response to “Cooling down the hot takes on Twitch”

  1. […] Twitch. Algunos lo ven como una divertida comunidad online de jugadores y fandoms de deportes electrรณnicos de buen humor. Para otros, es una corriente peligrosa de contenido potencialmente tรณxico y discurso de odio. En el panorama en constante progreso de la comunicaciรณn digital, la naturaleza en tiempo vivo de los mensajes a plataformas de reproducciรณn en directo como Twitch y YouTube Live conlleva retos รบnicos para la moderaciรณn del contenido. Actualmente, faltan herramientas efectivas para moderar el contenido en las transferencias en directo porque los modelos existentes se han entrenado en plataformas de redes sociales no en tiempo vivo como Facebook o Twitter. El asistente de investigaciรณn Dong-Ho Lee y el verificado principal Jay Pujara, los dos del Instituto de Ciencias de la Informaciรณn (ISI) de la USC Viterbi, se propusieron cambiar esto. Han desarrollado un mรฉtodo renovador que aumenta en un 35% el rendimiento de los modelos de moderaciรณn en las plataformas en directo. Pujara dijo: ยซSi publico poco en Twitter o Reddit, algรบn podrรญa objetar horas o dรญas mรกs tarde. Pero si miramos a Twitch, es un entorno muy diferente. La clan estรก enviando mensajes cada segundoยป. Todo se reduce al tiempo. Twitter, Facebook y Reddit son asรญncronos, donde los usuarios publican sus pensamientos, pero las respuestas no son inmediatas. Por otra parte, Twitch, YouTube Live y otras plataformas de transmisiรณn en directo son sincrรณnicas, lo que es el equivalente a estar en una conversaciรณn en directo. Para los que se inclinan por la ornitologรญa o los nerds que ama el humor bรบho, esta camiseta sabe whoooo hace que la ciencia sea divertida! La cรณmoda camiseta premium es ideal para ir a los libros o al laboratorio, dar paseos por la naturaleza a observar pรกjaros o simplemente hacer sonreรญr a sus compaรฑeros de bรบho y aficionados a la ciencia. Hoot hoot: es hora de evaporarse al frente de la clase armado con curiosidad y gozne de palabras! En las conversaciones en plataformas asรญncronas, los pensamientos se agrupan normalmente en una estructura de hilos que permiten un contexto conversacional. Y los usuarios no tienen limitaciones de tiempo, por lo que pueden comentar con respuestas mejor pensadas. Mientras que en las plataformas sรญncronas, los pensamientos se presentan en tiempo vivo, consecutivamente, sin estructura que indique el contexto. La naturaleza trepidante fomenta respuestas rรกpidas y mรบltiples comentarios breves. Un enfoque temprano de su tipo Viendo ese vano en la investigaciรณn, Lee y Pujara realizaron el primer estudio de PNL para detectar violaciones de normas en el chat en directo. Las ยซinfracciones de normasยป hacen relato a casos en los que los usuarios de plataformas online incumplen las reglas o directrices establecidas para un comportamiento aceptable. Pujara explicรณ: ยซNormalmente habrรก un conjunto de reglas que se publican cuando se unen [a live stream], y hay moderadores que intentan vigilar si la clan incumple estas reglas. ยฟEstรกs acosando a algรบn? ยฟEstรกs intentando cambiar el tema? ยฟEstรก enviando mensajes de spam? El equipo de autores, incluido ISI Ph.D. los estudiantes Justin Cho y Woojeong Jin y Jonathan May, profesor asociado de investigaciรณn en el รrea de Informรกtica de Viterbi Thomas Lord de la USC, utilizaron un conjunto de datos de 4.583 comentarios que violaban las normas en Twitch que fueron moderados por moderadores de canales humanos. ยซReunieron las reglas de chat de cada streamer de Twitch, celebraron reuniones iterativas para categorizar los tipos de infracciones de normas y gestionaron anotadores para etiquetar varias sesiones de transmisiรณn en directo para analizar las infracciones de las normas en Twitchยป, va dijo Lee, que continuรณ: ยซEsto implicรณ un esfuerzo conjunto importante. entre varios socios de la industria e instituciones acadรฉmicas para el primer estudio de las infracciones de normas en el chat en directoยป. Introduzca a los humanos… y los detalles Pujara dijo: ยซPoco interesante de cรณmo hicimos esto es que, para obtener la fรณrmula de los datos, hicimos una colaboraciรณn colectiva. Hicimos que les humanos lo etiquetaran y entonces estos humanos tenรญan bรกsicamente tres niveles de detalle. Asรญ pues, les fuimos dando progresivamente mรกs informaciรณn para poder evaluar lo que ocurreยป. ยฟQuรฉ tipos de detalles se proporcionaron? El equipo diseรฑรณ un proceso que determinarรญa el impacto de los distintos niveles de contexto en torno al comentario moderado. Por ejemplo, el historial del chat ha tenido un impacto: ยฟel zaguero mensaje del comentarista antaรฑo del contenido moderado o el chat mรกs amplio en torno al momento del comentario moderado? ยฟQuรฉ estaba pasando en el vรญdeo cuando se publicรณ el comentario? Y habรญa algรบn conocimiento extranjero relacionado con el contenido especรญfico del comentario (es afirmar, emojis o argot particulares adentro del canal). El contexto es crucial Resulta que, cuando se prostituciรณn de moderar las transferencias en directo, el contexto cuenta. Pujara explica sus hallazgos: ยซPuede mejorar la calidad de la moderaciรณn utilizando diferentes cantidades de informaciรณn. Por lo tanto, si estรก diseรฑando un sistema de moderaciรณn automatizado para Twitch, en realidad debe pensar cuรกl es el contexto adecuado para interpretar lo que dice la clanยป. El equipo utilizรณ esta informaciรณn, identificรณ el contexto informativo que mejor ayudaba a los moderadores humanos y formรณ modelos para identificar violaciones de normas aprovechando esta informaciรณn contextual. Sus resultados mostraron que la informaciรณn contextual puede aumentar el rendimiento de la moderaciรณn del maniquรญ en un 35%. Suscrรญbete al Boletรญn de parte Daily Dose y recibirรกs las mejores parte de ciencia de la maรฑana de todas partes de la web directamente en tu bandeja de entrada? Es posible como el domingo por la maรฑana. รšnete a la tira de correo electrรณnico de SCIENTIFIC INQUIRER u003cemu003eAl hacer clic en mandar, aceptas compartir tu direcciรณn de correo electrรณnico con el propietario del sitio y Mailchimp para cobrar marketing, actualizaciones y otros correos electrรณnicos del propietario del sitio. Utilice el enlace de derogaciรณn de la suscripciรณn de estos correos electrรณnicos para desactivarse en cualquier momento.u003c/emu003e Procesamiento… ยกร‰xito! Estรกs en la tira. ยกVaya! Se ha producido un error y no hemos podido procesar su suscripciรณn. Vuelva a cargar la pรกgina y vuelva a intentarlo. Asรญ: Me gusta cargando… Source link […]

Leave a Reply

Trending

Discover more from Scientific Inquirer

Subscribe now to keep reading and get access to the full archive.

Continue reading