A infraestrutura cognitiva da linguagem

Josie Helen Siman,
Thiago Oliveira da Motta Sampaio

Resumo

Michael Tomasello, um dos mais influentes pesquisadores dedicados ao estudo da evolução e da aquisição da linguagem, em sua palestra online para a Abralin ao vivo, apresenta sua tese de que a capacidade comunicativa humana, em amplo sentido, desenvolve-se antes da linguagem e é fundamental para explicar sua origem. Isto é, a capacidade comunicativa humana, que possui como infraestrutura uma gama de capacidades cognitivas gerais — como capacidades cooperativas, capacidade de inferir intenções, capacidade de decifrar gestos contextualmente, o que demanda o reconhecimento de common ground e atenção conjunta — são as condições básicas que permitem o desenvolvimento de uma linguagem humana complexa. Além disso, o autor demonstra como gestos (e.g. apontar) são usados de forma sofisticada por crianças, mas não por primatas não humanos. Desta forma, os gestos, apoiados na infraestrutura comunicativa, poderiam dar origem às convenções gramaticais.

Texto

O que diferencia os humanos dos demais animais? Uma das diferenças mais notáveis é a sofisticada capacidade humana para linguagem: nossa capacidade flexível de produzir infinitas sentenças hierarquicamente estruturadas e combinações semânticas. Outros animais não fazem isso. Na verdade, a comunicação dos animais não humanos é, em geral, constituída de padrões majoritariamente inatos e admite pouca flexibilidade contextual (cf. ARBIB, 2008[1]). Por exemplo, macacos nascem sabendo produzir vocalizações fixas, com significados fixos. Isto é, eles não aprendem essas vocalizações socialmente, apenas regulam a adequação social de suas vocalizações a partir de experiências sociais (SAPOLSKY, 1996[2]; TOMASELLO, 2018[3]).

Por outro lado, a linguagem humana apresenta estruturas sintáticas variáveis, sentidos arbitrários (baseados em convenções culturais), variações em modalidade de expressão (e.g. pode ser realizada através de gestos ou de vocalizações, frequentemente ambos), variações de formas de codificação de informações (e.g. tempo, aspecto e modalidade), etc. A linguagem humana é diferente da comunicação animal em vários aspectos. É, em geral, mais abstrata, mais complexa estruturalmente e mais variada. Um dos grandes desafios dos estudos linguísticos é entender a origem (evolutiva e ontogenética) da capacidade humana para linguagem. O que o humanos têm que os possibilitam desenvolver essa linguagem?

Michael Tomasello, um dos mais influentes pesquisadores dedicados ao estudo da evolução e da aquisição da linguagem, em sua palestra online para a Abralin ao vivo (TOMASELLO, 2020[4]), apresenta sua tese de que a capacidade comunicativa humana, em amplo sentido, desenvolve-se antes e é fundamental para explicar a capacidade linguística. Isto é, a capacidade comunicativa e pragmática humana, que possui como infraestrutura uma gama de capacidades cognitivas — como cooperação, inferência de intenções, capacidade de decifrar gestos contextualmente, o que demanda o reconhecimento de common ground e atenção conjunta — são as condições básicas que permitem a convencionalização de estruturas linguísticas. Sem essa infraestrutura, não há linguagem humana como a conhecemos.

Em sua palestra, Tomasello defende a importância de estudar os gestos humanos para entender a linguagem. Essa importância se dá porque, ontogeneticamente, as crianças usam gestos comunicativamente antes de usarem a linguagem, e alguns humanos usam exclusivamente a linguagem de sinais (ARBIB et al., 2008[1]). Além disso, os gestos acompanham a fala humana, que tem características multimodais (MCNEILL, 2006[5]). E, ainda, é importante notar que, entre os primatas não humanos, as vocalizações são inatas e fixas (hardwired), enquanto que os gestos são aprendidos. No entanto, os gestos dos primatas não humanos são diferentes dos gestos de uma criança pré-linguística em muitos aspectos.

Primatas não humanos gesticulam de forma ritualizada, como por exemplo, ao bater no chão para chamar atenção de outro primata para si. Trata-se de um gesto intencional, deliberado e aprendido (em vez de inato). Mas os gestos dos primatas não humanos são, em geral, diáticos (envolve comunicador e comunicatário) e diretivos, isto é, são gestos que têm por finalidade conseguir algo que o primata queira. Os gestos de bebês humanos são, por outro lado, triáticos (envolve comunicador, comunicatário e uma terceira entidade) e informativos, por exemplo, bebês apontam para coisas no mundo porque querem apenas mostrar algo, sem a intenção de obter esse item, ou mesmo com a intenção de compartilhar uma informação com o seu interlocutor. São gestos com propósitos sociais e cooperativos. Isso quer dizer que a infraestrutura cognitiva que nos diferencia dos demais animais já está presente antes da fluência linguística e, segundo Tomasello, esta é uma condição sine qua non para o desenvolvimento da linguagem.

Tomasello também enfatiza a importância do gesto de apontar. Apontar não tem significado nenhum sem a arquitetura “pragmática” humana. Se escondermos comida embaixo de uma lata e apontarmos para ela, sinalizando para um primata não humano que há algo ali para ele, esse primata não entenderá a mensagem (HARE; TOMASELLO, 2005[6]). Crianças entendem. A diferença é que o primata não humano não é capaz de inferir que o humano tem uma intenção cooperativa (uma pergunta a se fazer é se o primata não humano entenderia um gesto informativo produzido por um membro do seu grupo, ainda que eles não produzam esses gestos de forma espontânea). Ele é capaz de inferir intenções em contextos competitivos. Por exemplo, se houver uma disputa por recursos e o humano correr em direção à lata, o primata não humano é capaz de inferir que o humano quer aquela lata porque há comida ali. Mas ele não é capaz de fazer esse tipo de inferência em contextos cooperativos, em que o humano aponta para a lata informando de que há algo ali para ele (para o primata não humano). Para fazer esse tipo de inferência, um ser humano deve ser capaz de entender que “ele está apontando para algo porque isso é relevante para mim” (inferência recursiva).

Para que o gesto de apontar faça sentido, precisamos compartilhar um common ground, um conhecimento em comum com nosso interlocutor sobre a situação imediata ou sobre um histórico compartilhado culturalmente. Esse common ground é usado frequentemente em nossas conversas cotidianas. Por exemplo, quando uma pessoa pergunta “quer ir ao cinema hoje à noite” e outra pessoa responde “amanhã tenho que trabalhar”. Qual é a relação entre essa resposta e a pergunta? Só somos capazes de inferir a relação porque compartilhamos informações prévias, como a de que precisamos dormir cedo para acordar cedo no dia seguinte, ir ao cinema tarde da noite poderia atrapalhar, etc. Da mesma forma, um gesto de apontar só é entendido a partir de um common ground. Se uma pessoa apontar para uma cadeira, sem nenhum contexto prévio, não é possível saber o que esse gesto significa. Mas se uma pessoa está procurando por um lugar para se sentar, e a outra aponta para a cadeira, então o sentido do gesto passa a ser “sente-se ali”. Se uma pessoa está procurando madeira para queimar, o mesmo gesto significa “queime aquela cadeira”. Os gestos ao mesmo tempo indicam um fato (ali está x) e uma intenção (saiba que x, use x para…).

Em um experimento, Liebal et al. (2008[7]) produzem um contexto em que há um common ground entre criança e pesquisador, já que ambos participam de uma atividade que consiste em guardar brinquedos. Quando o pesquisador aponta para um brinquedo, a criança busca-o e guarda-o. Numa segunda condição, um segundo pesquisador, que não compartilha um common ground com a criança, entra na sala e aponta para um brinquedo. Nessa condição, a criança não sabe o que fazer com o brinquedo (ela sorri, ou o entrega para o segundo pesquisador, mas não o guarda). O gesto de apontar na segunda condição não é relevante para a atividade que a criança estava realizando antes.

Para Tomasello, gestos (como apontar) e pantomima são fatores chaves na transição para a comunicação convencional humana. Para que esses gestos, tipicamente humanos, possam funcionar, precisamos ter uma infraestrutura de intencionalidade compartilhada que evoluiu possibilitando atividades conjuntas colaborativas. As estruturas linguísticas são construídas sobre essas capacidades cognitivas tipicamente humanas. Sobre a intencionalidade compartilhada, Tomasello (2019, p. 7, tradução nossa[3]1) afirma que

as habilidades dos seres humanos de cooperar entre si assumem formas únicas, porque os indivíduos são capazes de criar uns com os outros um agente compartilhado "nós", operando com intenções compartilhadas, conhecimento compartilhado e valores sociomorais compartilhados. A reivindicação é que essas habilidades surgiram primeiro na evolução humana entre parceiros colaborativos operando diadicamente em atos de intencionalidade conjunta e depois entre indivíduos como membros de um grupo cultural em atos de intencionalidade coletiva.

Tomasello considera que a gramática é baseada em informações novas e dadas. Sendo assim, ele exemplifica como seria possível partir de gestos para construções gramaticais: o autor ilustra como uma criança, estando perto de sua mãe e de uma cadeira, e longe da mesa, pode apontar para a cadeira querendo dizer “quero a cadeira perto da mesa” (informação complementada pelo common ground compartilhado entre mãe e criança). Posteriormente, a mesma criança se encontra perto da mesa (i.e. a mesa é a informação “dada”) e aponta para a cadeira que está distante, para dizer exatamente a mesma coisa.

Em ambas as situações, o ato de apontar não é gramatical. Mas entender as situações através de múltiplos papéis semânticos ou participantes, e o fato de que a criança consegue navegar nesses quadros de informações flexíveis, baseado em informações dadas e novas (o que é fundamental para construções gramaticais) é a base para a criação de convenções gramaticais. Desta forma, haveria uma continuidade funcional entre gestos (apontar) e construções linguísticas, que estão fundamentadas em capacidades cognitivas específicas da nossa espécie: motivos cooperativos (e.g. informar, compartilhar) e cognição cooperativa (e.g. atenção conjunta e common ground).

A palestra de Tomasello é interessante para quem deseja entender quais aspectos da cognição humana são únicos à nossa espécie, como crianças pré-linguísticas se diferenciam de outros primatas e como uma infraestrutura cognitiva geral — baseada em cooperação, gestos e capacidades pragmáticas — pode dar suporte para nossa sofisticada capacidade linguística. O mais recente livro de Tomasello (2019[3]), Becoming Human, também é um importante complemento à palestra.

Referências

ARBIB, Michael A. et al. Primate vocalization, gesture, and the evolution of human language. Current anthropology, v. 49, n. 6, p. 1053-1076, 2008. DOI: https://doi.org/10.1086/593015

HARE, Brian; TOMASELLO, Michael. Human-like social skills in dogs?. Trends in cognitive sciences, v. 9, n. 9, p. 439-444, 2005. DOI: https://doi.org/10.1016/j.tics.2005.07.003

LIEBAL, Kristin et al. Infants use shared experience to interpret pointing gestures. Developmental science, v. 12, n. 2, p. 264-271, 2008. DOI: https://doi.org/10.1111/j.1467-7687.2008.00758.x

MCNEILL, David. Gesture: a psycholinguistic approach. The encyclopedia of language and linguistics, p. 58-66, 2006.

SAPOLSKY, Robert. Biology and Human Behavior: The Neurological Origins of Individuality. 2nd Edition. The Great Courses. 1996 (Dis-ponível apenas em audiobook).

TOMASELLO, Michael. Becoming human: A theory of ontogeny. Belknap Press, 2019.

COMMUNICATION Before Language. Conferência apresentada por Michael Tomasello [s.l., s.n], 2020. 1 vídeo (1h 17min 35s). Publicado pelo canal da Associação Brasileira de Linguística. Disponível em: https://www.youtube.com/watch?v=46IrwGZpDQ4&t=594s. Acesso em 13 jun, 2020.