10/06/2026
Você faz uma pergunta à IA do X: “O que é ditadura?”. Depois, muda não a pergunta, mas o perfil e o tipo de acesso.
No ensaio “Quanto vale ser sujeito? Efeitos de sujeito na constituição do arquivo do/no X”, Thiago César da Costa Carneiro compara quatro respostas geradas no X: em um perfil pessoal e em um perfil criado para a pesquisa, cada um nas versões gratuita e paga.
O texto não trata essas respostas como neutras. A questão é como texto automatizado, dados, pagamento, repetição e imagem do usuário se cruzam na plataforma. O ensaio também propõe “enunciado-comando” para pensar o que uma pessoa escreve quando pede que uma IA responda.
Leia em Cadernos de Linguística:
https://doi.org/10.25189/2675-4916.2026.V7.N3.ID944
09/06/2026
Quando você fala, as ideias não terminam onde apareceria um ponto-final no papel. Terminam onde a voz pausa, desacelera ou muda de tom. Pesquisadores vêm treinando modelos de computador para encontrar automaticamente esses fins de ideia. As aplicações são bem práticas: transcrição automática, assistentes de voz e ferramentas de acessibilidade.
O problema, conhecido nesse tipo de trabalho, é que um modelo que funciona bem em um conjunto de gravações pode falhar em outro.
Em um relato registrado publicado em Cadernos de Linguística, Caroline Adriane Alves, Rian Pereira Fernandes, Julio Cesar Galdino, Giovana Meloni Craveiro, Flaviane Romani Fernandes Svartman e Sandra Maria Aluísio descrevem o plano de testar um segmentador de fala do português brasileiro, treinado por aprendizado de máquina, num conjunto independente de gravações: 17 horas de conversas em São Paulo, gravadas entre 1971 e 1977, incluindo áudios com chiado, ruído de fundo e fitas degradadas.
O protocolo fixa os critérios de sucesso antes do processamento do áudio, então a resposta para "deu certo?" não pode ser ajustada depois. É exatamente para isso que serve um relato registrado: tornar o teste honesto antes de o teste acontecer.
📄 Testando a Eficiência de um Método de Segmentação Prosódica Automática Baseado em Aprendizado de Máquina para o Português Brasileiro
🔗 https://doi.org/10.25189/2675-4916.2026.V7.N1.ID912
09/06/2026
When you speak, ideas don't end where periods would on paper. They end where your voice pauses, slows down, or shifts in pitch. Researchers have been training computer models to spot those endings automatically. The applications are practical: transcription, voice assistants, and tools that make audio accessible.
But there is a familiar problem with this kind of work. A model that performs well on one set of recordings can stumble on another.
In a pre-registered protocol just published in Cadernos de Linguística, Caroline Adriane Alves, Rian Pereira Fernandes, Julio Cesar Galdino, Giovana Meloni Craveiro, Flaviane Romani Fernandes Svartman and Sandra Maria Aluísio describe their plan to test a machine learning segmenter for Brazilian Portuguese on a separate corpus: 17 hours of São Paulo conversations recorded between 1971 and 1977, including audio with hiss, background noise and tape damage.
The protocol locks in the success thresholds before any audio is processed, so the answer to "did it work?" cannot be quietly adjusted later. That is part of why a registered report matters: it makes the test honest before the test happens.
📄 Testing the Efficiency of a Machine Learning-Based Automatic Prosodic Segmentation Method for Brazilian Portuguese
🔗 https://doi.org/10.25189/2675-4916.2026.V7.N1.ID912
08/06/2026
Letícia Moraes has spent years studying how AI systems represent — or erase — minoritized identities in Brazil. Silvia Maria de Sousa has been investigating how AI constructs meaning in the texts it generates. Their article in Cadernos de Linguística is the result of those two questions finally meeting.
The study is grounded in a concrete test: does training data origin change what an AI considers real? The researchers chose two undocumented pieces of regional Brazilian slang — "muage" and "peseiro", used across Brazil's Northeast and Center-West — and asked both ChatGPT and Sabiá, a Brazilian-built AI, to define them. ChatGPT responded with Portuguese medieval documents and called that the word's primary meaning. Sabiá hedged, acknowledged regional variation, and asked for more context. Neither got it fully right, but the difference in how each model handled uncertainty says a great deal about whose knowledge ended up in its training data.
The authors argue that regional datasets are a start, not a solution. Building AI that is culturally fair also requires treating data as a meaningful artifact — one that carries cultural context, not just statistical patterns.
MORAES, L.; SOUSA, S. M. (2026). Generative AI and Meaning-Making: A Semiotic Approach from the Global South. Cadernos de Linguística, v. 7, n. 3, e925.
https://doi.org/10.25189/2675-4916.2026.V7.N3.ID925
08/06/2026
Letícia Moraes vem investigando há anos como sistemas de IA tratam identidades minorizadas no Brasil. Do outro lado, Silvia Maria de Sousa tem se dedicado a entender como a IA constrói sentido nos textos que produz. O artigo que as duas publicaram juntas em Cadernos de Linguística é exatamente o que acontece quando essas duas perguntas se encontram.
A pergunta que organizou o estudo foi direta: IAs treinadas com dados diferentes produzem respostas diferentes? Para responder, as pesquisadoras escolheram duas palavras regionais brasileiras não dicionarizadas — "muage" e "peseiro", gírias do Nordeste e do Centro-Oeste — e as submeteram ao ChatGPT e ao Sabiá, uma IA desenvolvida no Brasil. Os resultados foram reveladores. O ChatGPT respondeu sobre imposto portuário medieval em Portugal e classificou isso como o "sentido principal". O Sabiá hesitou, reconheceu a natureza coloquial das palavras e pediu mais contexto. Nenhum dos dois acertou completamente — mas a diferença na postura de cada modelo diz muito sobre de onde vieram os dados com os quais foram treinados.
A conclusão das autoras é que dados regionais são necessários, mas não suficientes. Construir IAs culturalmente plurais exige também uma curadoria cuidadosa do que esses dados carregam de sentido.
MORAES, L.; SOUSA, S. M. (2026). IA generativa e construção de sentido: abordagem semiótica a partir do Sul Global. Cadernos de Linguística, v. 7, n. 3, e925.
https://doi.org/10.25189/2675-4916.2026.V7.N3.ID925
07/06/2026
De onde vêm os sotaques? Como um falante do sul da França soa diferente de um parisiense, e como os ouvintes reconhecem essa diferença sem conseguir explicá-la?
São perguntas como essas que orientam o trabalho de Philippe Boula de Mareüil, Editor Associado de Cadernos de Linguística.
Philippe é Diretor de Pesquisa do CNRS (LISN, Orsay), onde lidera o tema de pesquisa sobre percepção e análise computacional da variação na fala. Suas pesquisas cobrem sotaques estrangeiros, regionais e sociais, e a variação entre diferentes estilos de produção oral: da leitura à conversa espontânea, dos registros contemporâneos ao do francês falado nas décadas de 1940 e 1950.
Com mais de 110 publicações e h-index 18, Philippe escreveu um livro de divulgação científica sobre sotaques regionais do francês e aparece regularmente na rádio e na imprensa francesa comentando variação linguística.
Como Editor Associado da CadLin, traz para a avaliação de manuscritos sua formação em fonética acústica e em métodos computacionais de análise da fala.
06/06/2026
Você abre o Google Chrome e, antes mesmo de pesquisar qualquer coisa, o navegador começa a construir um retrato de você. Cliques, histórico, localização: tudo vai para um perfil que empresas de tecnologia podem acessar e monetizar. Você abre o Tor e algo diferente acontece: a conexão passa por uma cadeia de servidores anônimos administrados por voluntários ao redor do mundo, e cada sessão termina sem deixar um rastro estável de quem você era online.
Thomas Falconi e Lucas Alves Selhorst, pesquisadores do Programa de Pós-Graduação em Ciências da Linguagem da UNISUL, analisaram essas duas situações em um ensaio teórico publicado na Cadernos de Linguística. O trabalho parte da Análise do Discurso materialista, abordagem que trata ambientes técnicos e linguagem como produtores de posições de sujeito, não como canais neutros.
O argumento central é que navegadores de internet funcionam como espaços políticos. O Chrome convoca o usuário a sincronizar conta, aceitar termos de personalização e assumir uma identidade digital rastreável. Os autores conectam isso ao que pesquisadores chamam de "colonialismo de dados": a extração de informações pessoais por grandes empresas como forma de poder, análoga às práticas extrativistas do colonialismo histórico.
O Tor funciona de outro modo. Ao encaminhar a conexão por múltiplos servidores descentralizados, impede que qualquer site identifique a origem do usuário. O resultado, argumentam os autores, é uma identidade digital provisória e fragmentada, que resiste ao processo de acumulação de dados pelas plataformas. Mas o ensaio também identifica uma contradição: a própria linguagem do Tor ainda se dirige a um "você" individual, sem escapar completamente à lógica da individualização.
Mais do que dois navegadores, Chrome e Tor representam duas formas diferentes de existir no digital.
Falconi, T.; Selhorst, L. A. (2026). Sujeito-avatar em espaços enunciativos informatizados: entre normatizações técnicas e práticas de resistência. Cadernos de Linguística, v. 7, n. 3, e980.
https://doi.org/10.25189/2675-4916.2026.V7.N3.ID980
06/06/2026
Open Google Chrome and, before you search for anything, the browser starts building a portrait of you. Your clicks, your history, your location — all logged into a profile that advertising platforms can reach. Open Tor and something different happens: your connection bounces through a chain of anonymous volunteer-run servers around the world, and each session ends without leaving a stable trace of who you were online.
Thomas Falconi and Lucas Alves Selhorst, researchers at the Graduate Program in Language Sciences at the Universidade do Sul de Santa Catarina (UNISUL), examined these two scenarios in a theoretical essay published in Cadernos de Linguística. Their framework comes from Materialist Discourse Analysis, a tradition that treats technical environments and language as producers of subject positions, not as neutral channels.
The essay's central argument is that web browsers function as political spaces. When you open Chrome, the browser prompts you to sync your account, accept personalization terms, and step into a trackable digital identity. The authors connect this to what researchers call "data colonialism": the extraction of personal data by large tech companies as a form of power, structurally similar to historical colonial extraction of resources.
Tor works differently. By routing connections through multiple decentralized servers, it prevents any site from pinpointing the user's origin. The result, the authors argue, is a provisional, fragmented digital identity that resists accumulation by platforms. But the essay also notes a contradiction: even Tor's own language addresses a "you" — an individual — so neither browser fully escapes the logic of individualization.
That's the essay's conclusion, and it's worth sitting with: more than two different browsers, Tor and Chrome represent two different ways of existing in the digital world.
Falconi, T.; Selhorst, L. A. (2026). Sujeito-avatar em espaços enunciativos informatizados: entre normatizações técnicas e práticas de resistência. Cadernos de Linguística, v. 7, n. 3, e980.
https://doi.org/10.25189/2675-4916.2026.V7.N3.ID980
05/06/2026
Oliver Niebuhr pesquisa há mais de 20 anos a melodia e o ritmo da fala. Seu trabalho examina como variações de tom, velocidade e qualidade vocal afetam o julgamento que ouvintes fazem da competência e do carisma de um falante.
É essa bagagem de pesquisa que ele traz para a função de editor associado de Cadernos de Linguística. Professor associado na Universidade do Sul da Dinamarca (SDU), lidera o laboratório de acústica do Centro de Eletrônica Industrial e é editor associado de Phonetica e do Journal of the International Phonetic Association (JIPA).
https://cadernos.abralin.org/index.php/cadernos/about/editorialTeam
04/06/2026
Você já parou no meio de um podcast para se perguntar: por que ele escolheu exatamente essa palavra?
Em setembro de 2024, oito candidatos à prefeitura de São Luís (MA) foram entrevistados no podcast "Abrindo o Verbo", do Sistema Mirante. Os pesquisadores Ramon de Almeida Miranda e Ana Maria Sá Martins, da Universidade Estadual do Maranhão (UEMA), decidiram examinar uma dessas entrevistas com atenção.
O estudo, publicado nos Cadernos de Linguística (v. 7, n. 3, 2026), foca na entrevista com o candidato Yglésio Moyses (PRTB). Ao longo de quase uma hora, Moyses falou sobre licitações, ab**to, educação e direitos LGBTQIA+. Os pesquisadores selecionaram seis trechos e os analisaram com base na Análise Crítica do Discurso, abordagem que estuda como a linguagem é usada para exercer poder e construir identidades sociais.
O estudo argumenta que expressões como "comunistas", "ideologia de gênero" e "covarde" não são simples escolhas retóricas: elas acionam discursos já circulantes na esfera pública para posicionar o falante, desqualificar adversários e fazer com que determinados valores pareçam senso comum. A análise mostra também como Moyses constrói sua própria identidade política como transparente e democrática, em contraste com o retrato autoritário que traça de seu rival.
O argumento central é direto: o podcast político não é um espaço neutro, e desenvolver uma escuta crítica começa por prestar atenção nas palavras que são escolhidas.
https://doi.org/10.25189/2675-4916.2026.V7.N3.ID947