Resumo

Uma exposição conceitual simples da Teoria dos Sistemas Dinâmicos prefacia a apresentação dos artigos desta coletânea. Introduz-se a noção de sistema dinâmico, nas suas formas simples e complexa, sem recurso a formalismos. O pano de fundo assim delineado permite fazer de cada artigo um ensejo para comentar os avanços da Fonologia Articulatória (ou Gestual) e modelos dinâmicos afins a partir da virada do século. Mostra-se que a nossa produção atual justifica o crescente interesse brasileiro pela abordagem dinâmica em Fonologia.

Introdução

A Linguística do século XXI está assistindo a uma mudança de paradigma que, contrariamente à clássica descrição de KUHN (1962), está sendo gradual e não abrupta. Não se trata, porém, de um rompimento gradual com o passado. Os cientistas que hoje aderem à nova visão o fazem tão abrupta e apaixonadamente quanto os que abraçaram a gramática gerativa nas décadas de 1960 e 1970. O que está tomando forma e se impondo gradualmente é o próprio paradigma alternativo, cujo fio condutor mais visível é a tentativa de entender a linguagem como um sistema dinâmico. A razão é que, sendo a abordagem originária das ciências naturais, só as subáreas fronteiriças da Linguística, tais como a Fonética/Fonologia e a Psicolinguística, estão, atualmente, em condições de explorá-la.

Em ALBANO (2009) já tratei dos principais veios da concepção dinâmica de linguagem surgida no final do século XX. Cabe, agora, retomar algumas dessas ideias e examinar os aportes do século XXI ao novo paradigma, a fim de introduzir os trabalhos deste número, que constituem uma expressiva amostra dos seus primeiros reflexos na Linguística brasileira. O foco recairá na Fonética/Fonologia, área de proa da revolução kuhniana, à qual se vinculam as contribuições a seguir. Áreas correlatas tais como a Morfologia serão também abordadas quando oportuno.

Convém começar por um ponto particularmente sensível para a comunidade científica da Linguística: o vínculo da concepção dinâmica de linguagem com a Física Estatística e as suas implicações para o estatuto da nossa disciplina como ciência humana e social. Retomarei aqui a posição defendida no artigo citado, a saber: a de que esse tipo de aproximação com as Ciências Naturais não é necessariamente reducionista, na medida em que o novo paradigma está aparelhado para lidar com situações de alta complexidade e tem sérias pretensões transdisciplinares. Sustento, portanto, que a sua disseminação pode até, ao contrário, fomentar a atitude humanista entre os nossos prováveis parceiros na empresa: os cientistas exatos e/ou naturais interessados na linguagem.

Assim, o objetivo desta coletânea é mostrar que a atual mudança de paradigma traz consigo não apenas novas ferramentas – cuja natureza quantitativa produz um compreensível estranhamento inicial – mas, sobretudo, novos conceitos, que, mediante um domínio apenas básico da quantificação, são suficientes para habilitar o linguista a explorar a nova perspectiva e, através dela, alargar o seu horizonte empírico e a sua interlocução com outras áreas do saber.

Para facilitar a tarefa do leitor, tento, abaixo, introduzir a noção de sistema dinâmico, com ênfase em modelos já aplicados à nossa área. Em seguida passo a mostrar como as contribuições deste número fazem uso do aparato conceitual do novo paradigma para extrair de dados fonéticos informações sobre unidades fônicas e/ou gramaticais de natureza dinâmica, ampliando, assim, a compreensão das fonologias das línguas em estudo, a saber: o português brasileiro (doravante PB), o inglês, o karitiana, o ruandês e o amárico.

1. Sistemas dinâmicos

Não se pode definir um sistema dinâmico com precisão sem recorrer à Matemática: denomina-se dinâmico um sistema de equações diferenciais cuja variável independente é o tempo. Essa definição não deve intimidar o leitor. Uma equação é dita diferencial se tem como incógnita uma função que possui taxas de variação – ou, em jargão matemático, derivadas. Não obstante, tudo o que precisamos saber sobre tais equações é que descrevem a variação de algo no tempo. Esse algo costuma ser pensado como um móvel deslocando-se num espaço – seja ele o espaço físico propriamente dito ou algum espaço virtual, definido por variáveis abstratas (STROGATZ, 1994).

Na Física e na Matemática, a noção de sistema dinâmico surgiu da necessidade de se construir uma teoria geral dos sistemas que passam de um estado a outro no tempo de forma regrada, ainda que se iniciem de forma aleatória. São exemplos: os movimentos de um pêndulo, de um veículo, de um satélite, etc. O conceito pode também aplicar-se a outros “móveis” – p.ex., as rotações de um motor, as cotações de uma ação, o preço de um produto, o tamanho de uma população, etc. –, estendendo o alcance da teoria a muitas outras áreas. Aplica-se, na verdade, a quaisquer objetos capazes de descrever uma trajetória imaginária num espaço de estados1 para o qual haja uma medida de distância que viabilize o uso de equações de movimento.

Dois fenômenos linguísticos conhecidos são fáceis de assimilar intuitivamente a um sistema dinâmico: a formação de constrições no trato vocal e a evolução diacrônica das frequências de ocorrência das variantes de uma unidade fônica ou gramatical (p.ex., alofones, alomorfes, marcadores gramaticais, etc.). Visto que a abscissa do espaço que define uma trajetória é sempre o tempo, a ordenada é dada, no primeiro caso, pelas distâncias momentâneas do ponto de constrição máxima do trato vocal frente à sua posição de repouso. No segundo, ela é dada pelos desvios momentâneos das frequências de ocorrência da variante linguística em questão frente ao aleatório. O fato de os “momentos” serem muito maiores no segundo caso do que no primeiro é perfeitamente natural, já que a noção de sistema dinâmico se aplica a qualquer escala de tempo (PORT & VAN GELDER, 1995).

A simplicidade desses exemplos não deve nos levar a subestimar o tamanho da mudança de perspectiva implicada. Trata-se de incorporar à Linguística duas noções que dela se excluíram por razões metodológicas bem estabelecidas desde os seus primórdios: o tempo e o movimento.

Rompimento radical com as tradições já centenárias da análise fonêmica e da descrição sincrônica? Sim, mas apenas em termos.

É que a noção de sistema dinâmico concilia categorias discretas com graus, gradientes ou contínuos. O aparente passe de mágica é dado por uma noção surgida para captar momentos de estabilidade na trajetória instável de um sistema dinâmico: o atrator. Um atrator é um ponto no espaço de estados de um sistema dinâmico para o qual a sua trajetória tende a convergir em todas as suas iterações. Por exemplo, um pêndulo real, sujeito a atrito, tem um atrator pontual, que é o seu ponto de repouso. Já um pêndulo ideal, livre de atrito, tem um atrator cíclico, que é o seu período. Ambos os tipos de atratores definem comportamentos estáveis, categóricos, em sistemas instáveis, fora de equilíbrio e, portanto, sujeitos a comportamentos gradientes e até caóticos.

Nessa perspectiva, uma categoria linguística é um atrator no espaço de estados de uma variável quantitativa de valor inicial aleatório. Por exemplo, as trajetórias que especificam as variantes de /e/ e /i/ são dadas pelo grau de constrição do trato vocal. Assim, o grau de abertura para o qual convergem as realizações do gesto articulatório abstrato implicado em /e/ é maior do que aquele para o qual convergem as realizações do gesto articulatório abstrato implicado em /i/, embora as realizações desses alvos ideais se dispersem e até se imbriquem. Como testemunham as inúmeras línguas que possuem a distinção, os alvos de /e/ e /i/ são atratores naturais no espaço de estados da dimensão fonética de abertura.

De volta ao fonema? Sim e não.

Sim, porque os gestos articulatórios especificam a trajetória da constrição e não a cinemática dos articuladores. Nos sistemas dinâmicos típicos da motricidade humana e animal (KELSO, 1995; THELEN, 1995), a trajetória decisiva é a da tarefa (no caso, constranger o trato) e não a dos efetores que a realizam. Ela tende sempre a convergir para a região do espaço de estados onde há um atrator, qualquer que seja a posição inicial de cada efetor. Assim, a alofonia decorrente da variação das trajetórias dos articuladores em diferentes contextos torna-se natural, perdendo o caráter problemático que tem para a análise fonêmica categórica. É, até, esperada, pois a flexibilidade e a organização funcional das partes envolvidas na realização da tarefa são uma característica geral dos sistemas dinâmicos biológicos.

Não, porque, em decorrência do acima exposto, uma oposição definida por dois atratores, diferentemente das definidas por dois fonemas, nunca é livre de contexto. Diferentes posições na palavra podem ter espaços de estados diferentes, com atratores diferentes, para sons que a tradição considera o mesmo fonema. Por exemplo, o abaixamento da mandíbula no acento intensivo, típico das línguas de ritmo acentual, tende a provocar uma redução da abertura nas sílabas átonas que pode levar a uma redução do inventário vocálico átono, como ocorre em português. Uma fonologia dinâmica especifica diretamente no léxico os alofones posicionais decorrentes, com os respectivos graus de undershoot ou redução.

Multiplicação da alofonia e remissão ao infinito das entradas lexicais?

Não, porque outro problema da tradição categórica que desaparece no novo paradigma é a limitação estrita do espaço de armazenamento de informações, i.e., a memória. Com uma memória ampla, expansível e, sobretudo, ativa (PORT, 2007), o léxico deixa de ser uma mera lista de formas canônicas arbitrárias das palavras. Variantes constituídas, por exemplo, de gestos articulatórios diferentes podem aí se acumular sem fatalmente formar uma coleção desorganizada, caótica, já que a canonicidade e a prototipicidade são propriedades que emergem em sistemas dinâmicos, graças, mais uma vez, à formação de atratores (DOURSAT & PETITOT, 2005).

Eis, porém, um tema que não se pode desenvolver sem introduzir mais uma classe de sistemas dinâmicos comuns na natureza: os sistemas adaptativos complexos.

2. Sistemas adaptativos complexos

Os sistemas adaptativos complexos são um caso particular dos sistemas complexos, i.e., sistemas dinâmicos compostos de múltiplas partes nos quais as propriedades do todo são imprevisíveis a partir das propriedades das partes (HOLLAND, 1992). Assim, a noção de complexidade é uma espécie de resgate, por parte da ciência contemporânea, da famosa máxima dos psicólogos da Gestalt ou teoria da forma: o todo é mais que uma soma de partes (WERTHEIMER, 1900). Os sistemas complexos possuem propriedades emergentes que decorrem do seu funcionamento não linear, a saber: neles a retroalimentação soma-se à interação entre as partes para tornar a saída desproporcional à entrada2. Para ser adaptativo, um sistema complexo deve, além disso, aprender com a experiência.

A complexidade abunda na natureza. São exemplos: a turbulência, o clima, os enxames de insetos, as revoadas de pássaros, etc. Em todos esses casos, o comportamento coletivo vai além das interações locais entre as partes. Para entendê-lo, costuma-se recorrer à matemática da dinâmica não linear, que envolve equações de movimento com soluções geométricas nas quais medidas das relações entre as partes (p. ex., distâncias, ângulos, conectividade, etc.) são plotadas num mesmo espaço. Um sistema complexo retroalimentado por uma memória da sucessão dos seus espaços de estados relacionais é chamado de adaptativo na medida em que o seu comportamento muda com o tempo, caracterizando uma aprendizagem. São exemplos: os organismos, o sistema nervoso, os ecossistemas, os grupos sociais, os mercados de ações.

Na última década, as analogias da linguagem com esses sistemas explodiram na literatura, graças à ofensiva da Lingüística Cognitiva no sentido de combater a tese gerativista da especificidade da linguagem (CROFT & CRUSE, 2004). Quando se pensa a capacidade linguística não como um módulo mental à parte, mas como um sistema emergente, enraizado, ontogenética e filogeneticamente, no funcionamento cognitivo geral e na interação social, o todo pode se comportar como mais que uma soma de partes de maneiras várias e complexas. Assim, regularidades linguísticas emergiriam espontaneamente do uso, o qual, por sua vez, teria emergido da diversidade das interações sociais, as quais, por sua vez, teriam emergido de capacidades sócio-cognitivas gerais compartilhadas – p.ex., a atenção e a ação conjuntas, a imitação, a reciprocidade, etc. Uma vez emergidas, essas partes se retroalimentariam e alimentariam umas às outras, formando um todo intrincado cuja evolução é apenas parcialmente previsível.

O novo paradigma tem sido fomentado, de um lado, por estudos que, surgidos sob a inspiração da Linguística Cognitiva, exploram primordialmente os conceitos da Dinâmica, e, de outro, por estudos que, imersos na Ciência Cognitiva, exploram primordialmente as suas ferramentas. Ainda que os trabalhos desta coletânea estejam no primeiro caso, será útil passar em revista aqui os métodos implicados no segundo, pois um conhecimento da sua lógica, assim como dos seus limites, é essencial a quem quer que deseje se aventurar nesta nova Fonologia. Ou seja, uma boa hipótese dinâmica é sempre explícita, formalizável e computável, ainda que não tenha sido alvo de experimento comportamental ou computacional.

Atualmente, os modelos computacionais mais usados para tratar as línguas naturais como sistemas adaptativos complexos são as redes neurais recorrentes, as redes ou grafos complexos e os agentes adaptativos.

As redes neurais recorrentes são a principal ferramenta do conexionismo, primeira vertente da abordagem dinâmica a surgir na Ciência Cognitiva e ganhar espaço na Linguística, conforme historiado em ALBANO (2009). Elas constituem um aperfeiçoamento das redes neurais simples, constituídas por um conjunto de unidades – os chamados neurônios – conectadas em rede por funções de ativação e organizadas em duas camadas: a de entrada e a de saída. As redes recorrentes possuem, além disso, duas outras camadas que aumentam o seu poder computacional: a camada escondida, cujas ativações respondem ao input, e a camada de contexto, que registra o histórico de ativação da camada escondida e a retroalimenta, tornando-a capaz de aprender (ELMAN, 1991).

As redes neurais recorrentes vêm sendo usadas na Fonologia para modelar relações associativas (LI & MACWHINNEY, 2002), tais como as encontradas na morfofonologia e na fonotaxe – p.ex., a alomorfia, a harmonia vocálica – ou, ainda, na prosódia – p. ex., a relação entre o acento e a qualidade vocálica. Embora suponha uma entrada categorizada, esse tipo de rede não produz categorias discretas. Diz-se que a rede aprendeu uma regra quando a sua saída se torna previsível a partir da sua entrada. Isso geralmente ocorre se as ativações da camada escondida se estabilizam após múltiplas iterações. Ainda que se formem atratores no processo, eles não se traduzem diretamente na linguagem simbólica da expressão tradicional de regras. A representação da regra na rede é chamada de distribuída justamente por residir não em alguma propriedade local e, sim, no padrão estável das suas conexões. Trata-se, na verdade, de uma simulação computacional da noção clássica de aprendizagem hebbiana3 (HEBB, 1949).

A emergência de categorias, pressuposto central do novo paradigma, presta-se melhor à simulação pelos dois outros tipos de redes adaptativas complexas.

As redes ou, em linguagem matemática, grafos complexos permitem estudar a emergência de categorias novas a partir de categorias existentes (PARDO et al, 2006). As unidades ou nós desse tipo de rede são conectadas por arestas ou vértices derivados de alguma medida de distância entre os objetos modelados. Outras medidas são computadas para avaliar a conectividade dos nós e a sua aglomeração relativa. Se tais medidas são coletadas ao longo do tempo, podem-se calcular a probabilidade de emergência de novas conexões e aglomerações, e cotejar a estrutura da saída do modelo com a hierarquia das categorias tradicionais dos objetos modelados. Por exemplo, com o auxílio de uma medida de distância entre as consoantes, dados longitudinais poderiam, em princípio, revelar aglomerações tais como ‘soantes’ e ‘obstruintes’ em simulações da evolução do inventário consonantal de crianças em aquisição de linguagem.

Finalmente, os agentes adaptativos (BONABEAU, 2001) oferecem a mais promissora opção para modelar a emergência de categorias a partir da interação social. Esses agentes são unidades computacionais autônomas dotadas de mecanismos mínimos de percepção e ação (p.ex., um analisador e um sintetizador ótico ou acústico), assim como de capacidade mínima de interagir entre si (p.ex., responder, imitar). Podem ser usados, por exemplo, para modelar a emergência e a expansão de um léxico a partir de uma combinatória de unidades simples, ou, ainda, para simular a evolução de um sistema fônico elementar, formado, por exemplo, de vogais (DE BOER, 1999).

A pincelada acima está longe de fazer justiça aos modelos computacionais dinâmicos empregados hoje nas fronteiras entre a Ciência Cognitiva e a Linguística. Serve, porém, para dar ao linguista uma ideia da transparência da sua lógica, muitas vezes ocultada pela complexidade das suas computações, que podem intimidar os não-iniciados.

Abaixo passo a comentar a forma de inserção dos artigos desta coletânea no paradigma dinâmico e a apontar como as evidências articulatórias e acústicas oferecidas pelos autores poderiam, em alguns casos, inserir-se num tipo de colaboração, ainda incipiente no Brasil, em que a simulação computacional corrobora e refina hipóteses nascidas da análise linguística minuciosa.

Espero mostrar, assim, que as duas metodologias são essenciais e complementares, não podendo substituir uma à outra. Se, de um lado, o escrutínio qualitativo do linguista afasta simplificações espúrias e explora o lado indiciário da quantificação, de outro, a expertise quantitativa e computacional do cientista cognitivo busca simplificações engenhosas que permitam enxergar padrões de comportamento comuns à linguagem natural e a outros objetos do mundo físico e social. Essa nova interdisciplinaridade não faz mais, na verdade, do que seguir os passos de Saussure, Trubetzkoy, Stetson, Zipf e Jakobson4, ao buscarem inspiração em áreas cuja afinidade com a Linguística não era óbvia no seu tempo.

3. A coletânea e suas bases teóricas

Esta coletânea compõe-se de dois estudos de problemas de descrição fonológica, três estudos de aquisição de sistemas fônicos e dois estudos de variação e mudança nesses sistemas.

O trabalho de Didier Demolin, intitulado “The experimental method in phonology”, é, ao mesmo tempo, uma defesa do método experimental na Fonologia e um convite à reflexão sobre as vantagens da abordagem dinâmica dos segmentos fônicos para a teoria fonológica. Depois de um alentado panorama da história da metodologia experimental em Fonologia, o autor expõe três exemplos em que a coleta e o tratamento experimentais do detalhe fonético faz uma grande diferença para a interpretação do sistema fonológico como um todo.

O primeiro diz respeito a uma língua indígena brasileira, o Karitiana, cujo inventário vocálico apresenta a seguinte raridade tipológica: uma lacuna no lugar da vogal [u], aliada a muitas ocorrências de [o] longo e breve. Através de um experimento de percepção com fala sintética, o autor demonstra que falantes nativos rejeitam a inserção de [u] no lugar de /o/; e delineia uma análise que não só respeita a assimetria do sistema, mas também incorpora o detalhe fonético à representação fonológica.

O segundo exemplo concerne à presença de dois tipos de segmentos intrusivos variáveis numa língua banta, o ruandês, a saber: um breve clique que pode ocorrer entre duas nasais numa sequência tal como [nǃŋw]; e uma breve vogal que pode ocorrer em sequências análogas onde, porém, a segunda nasal é sempre velar, tal como [məŋw]. A análise do autor atribui tais intrusões ao timing dos gestos articulatórios envolvidos nas sequências, evitando, assim, a postulação de processos arbitrários de inserção, com considerável economia para a descrição fonológica. Estendida aos segmentos complexos do ruandês, essa análise economiza também primitivos fônicos: certas raridades tipológicas, tais como as oclusivas labiovelarizadas e pré-nasalizadas, não mais precisam ser listadas como exceções. A raridade a registrar é apenas o modo de coordenação dos gestos articulatórios envolvidos: em ruandês, o que explica certos segmentos complexos comuns, tais como [n hŋ w], é uma ligeira defasagem, corroborada instrumentalmente, entre a adução das pregas vocais, o abaixamento do véu palatino, a elevação do dorso da língua e a labialização.

O terceiro exemplo diz respeito ao Amárico, língua semítica falada na Etiópia, com a qual o autor testa e respalda a hipótese da indivisibilidade das geminadas, de LADEFOGED & MADDIESON (1996). O Amárico possui outra raridade tipológica: as fricativas e africadas geminadas, tanto comuns como ejetivas. Uma comparação acústica, aerodinâmica e palatográfica das geminadas com suas contrapartes simples revela importantes diferenças que, segundo Demolin, também se explicam por defasagens sutis entre gestos articulatórios orais e glóticos; ou, ainda, por gestos de elevação da laringe, no caso das ejetivas. Esse timing incomum, que exige fino controle sensório-motor por parte do falante, explica, além disso, por que não é possível quebrar uma geminada por meio de uma vogal epentética.

Aos interessados na abordagem dinâmica da Fonologia, o artigo oferece pelo menos duas lições: a primeira é que muito se pode inferir sobre a atividade articulatória através da conjugação de métodos fonético-instrumentais. A segunda é que essas inferências deixam de ter um estatuto meramente descritivo se acompanhadas de uma base teórica adequada.

A esta altura já deve estar claro que o modelo teórico que embasa o raciocínio de Demolin, assim como o da maioria dos autores, é a Fonologia Articulatória ou Gestual, proposta por Catherine Browman e Louis Goldstein no Laboratório Haskins na década de 1980 (BROWMAN & GOLDSTEIN, 1989, 1992). Embora eu já tenha dedicado um livro à apresentação e discussão desse modelo (ALBANO, 2001), será preciso passar em revista aqui a sua versão atual, que já dista bastante da de então.

O que mudou no que hoje prefiro chamar de Fonologia Gestual (doravante FonGest), alinhando-me aos que veem os gestos vocais como parte da gestualidade geral (ARBIB, 2005; CORBALLIS, 2010), é a forma de simplificação e formalização utilizada na tentativa de entender a fala como um sistema dinâmico.

A FonGest teve um período heroico em que era preciso convencer a comunidade científica de que a alofonia gradiente não é diferente da categórica, na medida em que ambas podem ser modeladas por sistemas dinâmicos simples, do tipo massamola5. Bastava, naquele momento, mostrar que alguns gradientes fônicos resultam de instabilidades em sistemas dinâmicos que possuem atratores pontuais biunivocamente relacionados a categorias fonéticas. Assim, um achatamento/encurtamento da trajetória da tarefa articulatória ou um aumento/diminuição da sobreposição das trajetórias de uma sequência de tarefas costumam ter sucesso em modelar processos fônicos de lenição, apagamento e mesmo inserção (p.ex., as epênteses do ruandês). Cabe ressaltar, a propósito, que, no modelo massa-mola, o timing dos gestos articulatórios não é previsto, mas estipulado a partir de estimativas baseadas em medidas acústicas e/ou articulatórias.

Com o tempo, a interlocução com outras áreas, especialmente a Psicologia da Motricidade (KELSO, 1995), deixou claro que essas estipulações eram heranças indesejáveis dos modelos fonológicos simbólicos. Passou-se então a recorrer não mais à simplificação minimalista do modelo massa-mola e, sim, a um modelo bem mais complexo, porém já destrinchado pelas Ciências Naturais e Engenharias: o de osciladores acoplados.

É possível acoplar fisicamente dois pêndulos ou dois sistemas massa-mola por meio, digamos, de uma mola. Nessas condições suas vibrações não podem se dissociar, influenciando umas às outras. É assim também na natureza: enxames de vagalumes, entre outros objetos cintilantes ou oscilantes, tendem a se comportar de forma coordenada por estarem acoplados em termos físicos ou informacionais. O acoplamento pode afetar a frequência, a amplitude ou a fase dos osciladores, sendo o último caso o mais conhecido no estudo da motricidade. Assim, a coordenação motora humana e animal tende a reproduzir os dois modos básicos de sincronização dos osciladores em geral: a fase e a antifase.

Dois osciladores em fase iniciam as suas trajetórias ao mesmo tempo, ou seja, a 0º no círculo trigonométrico. Já dois osciladores em antifase alinham suas trajetórias de tal forma que uma se inicia quando a outra chega à metade, ou seja, quando estão, respectivamente, a 0º e 180º no círculo trigonométrico. Segundo a FonGest, as relações de fase e antifase explicam as duas principais estruturas silábicas das línguas do mundo, a saber: CV e (C)VC. A primeira resulta da sincronização em fase do gesto consonantal com o gesto vocálico. A segunda resulta, por sua vez, da sincronização dos mesmos gestos em antifase (GOLDSTEIN et al. 2007a, 2009).

Quatro artigos desta coletânea valem-se dessas duas noções para explicar os seus dados fonético-instrumentais (V. MEDEIROS; BERTI & FERREIRA GONÇALVES; FREITAS & ALBANO E ZIMMER & ALVES, neste número). Deve-se, entretanto, ressaltar que, justamente por responderem pelos universais da sílaba, elas deixam automaticamente de fora a diversidade e a complexidade das estruturas silábicas menos comuns. Não dão conta, por exemplo, de casos como os do ruandês e do amárico, os quais certamente envolvem relações de fase menos naturais, cujo uso proficiente fica restrito às comunidades falantes imersas numa língua que as tenha desenvolvido.

O estudo de Beatriz Raposo de Medeiros, intitulado “Uma proposta sobre a coda do Português Brasileiro a partir da Fonologia Gestual, com foco especial na nasal”, retoma a discussão, iniciada por ALBANO (1999), à luz da primeira versão da FonGest, do processo de vocalização, total ou parcial, das consoantes que historicamente ocupam a posição de coda no PB. Com base em dados acústicos e aerodinâmicos, a autora levanta a hipótese de que o gesto de abaixamento do véu palatino esteja mais ou menos alinhado a um gesto oral de coda6 – este mais ou menos vocalizado, a depender do contexto adjacente. Assim, a identidade segmental da coda nasal é indefinida: passa gradualmente de uma constrição vocálica a uma constrição consonantal, podendo variar entre extremos tais como uma aproximante homorgânica à vogal precedente e uma oclusiva homorgânica à oclusiva seguinte. Embora o fenômeno ainda não esteja inteiramente esclarecido, o que os dados sugerem é que essa aproximante nasal tende a não apenas estar em antifase com a vogal, mas também a apresentar sincronização parcial de amplitude e frequência com a consoante seguinte7.

É oportuno esclarecer, a propósito, que a sincronização de dois ou mais osciladores acoplados pode ocorrer nos domínios da frequência, da amplitude e da fase – fenômeno conhecido como entrainment, geralmente traduzido como arrastamento ou carreamento: i.e., o oscilador conduzido fica travado (locked) na sincronia ou sintonia8 com o que o arrasta ou carreia (entrain). Num sistema mecânico, a capacidade dos osciladores arrastarem uns aos outros depende das suas características físicas. Quando, porém, o acoplamento é mais informacional que mecânico, como no caso da motricidade, pode ocorrer arrastamento parcial. Trata-se de uma sincronia ou sintonia incompleta, que apenas aproxima, sem igualar, o comportamento dos osciladores envolvidos. As condições exatas sob as quais esse fenômeno ocorre ainda são desconhecidas. Trata-se, de qualquer modo, de uma possibilidade a considerar no quadro da abordagem dinâmica das alofonias gradientes.

O artigo de Larissa Berti e Giovana Ferreira-Gonçalves, intitulado “A aquisição do contraste entre /t/ e /k/ sob a ótica dinâmica”, apresenta um intrigante estudo de produção de fala em três crianças sem queixas fonoaudiológicas com idades em torno dos três anos. Embora os dados tenham sido coletados com a intenção de investigar o processo de anteriorização, que parece ser um universal do desenvolvimento fonológico, observaram-se aparentes substituições em ambas as direções, i.e., de /k/ para /t/, conforme esperado, e vice-versa. Além de mostrar, com análises acústicas, que a maioria dessas “substituições” envolve contrastes encobertos, as autoras levantam três hipóteses para a sua explicação: dificuldade de diferenciação motora entre os gestos de ponta e corpo da língua; sintonia ou assintonia entre o gesto consonantal e o gesto vocálico; e intrusão antecipatória de um gesto planejado, como nos lapsos adultos de “troca” de consoantes (GOLDSTEIN et al., 2007b). Apenas a primeira hipótese é descartada, com base na idade das crianças e no fato de elas serem capazes diferenciar os dois locais de constrição em outros contextos. Já as duas outras estão equiparadas perante os dados disponíveis: a assintonia dissimilatória adequa-se melhor à anteriorização, enquanto a intrusão antecipatória adequa-se melhor à posteriorização. Depois de demonstrar que o desafio de novas rotinas articulatórias pode levar certas tarefas a apresentar uma curva em U (i.e., uma queda brusca de desempenho, seguida de platô e elevação) e que esse cenário é compatível com ambas as hipóteses, as autoras concluem apontando para a necessidade de prosseguir na investigação do fenômeno com o auxílio não só de novos dados, mas também de novos instrumentos, especialmente de observação e análise articulatória.

Uma reorganização precedida por uma desorganização é um fato recorrente em vários setores do desenvolvimento infantil (THELEN & SMITH, 1994). Nem sempre, entretanto, a trajetória do sistema dinâmico envolvido é caracterizada por uma curva em U. Outro padrão comum é a alternância em ziguezague entre o “erro” e o “acerto” perceptíveis, ocultando, na verdade, uma gradação entre eles que só a metodologia experimental pode revelar. O artigo intitulado “O gesto fônico na aquisição ‘desviante’: movimentos entre a produção e a percepção”, de Maria Cláudia Camargo Freitas, em coautoria comigo, traz um exemplo cuja originalidade reside em abordar, ao mesmo tempo, a produção e a percepção da fala. Crianças de cerca de cinco anos com diagnóstico de transtorno fonológico são comparadas a pares etários sem queixas dessa natureza em experimentos que testam a capacidade de perceber e produzir obstruintes iniciais. Os resultados revelam semelhanças importantes entre os dois grupos: ambos apresentam estados intermediários entre o acerto e o erro categórico tanto nas medidas de percepção quanto nas medidas de produção, ainda que a oitiva tenda a atribuir 100% de acerto às crianças do grupo controle. O que, possivelmente, está em jogo aí é a taxa de estabilização dos parâmetros que caracterizam os contrastes fônicos estudados. No grupo alvo, a sua produção, assim como a sua percepção, desvia-se da média mais acentuada e persistentemente do que no grupo controle. Esse achado tem consequências inovadoras para a terapia fonoaudiológica, pois caracteriza a diferença entre os dois grupos como quantitativa e não qualitativa, sugerindo que crianças com diagnóstico de transtorno podem superar as suas dificuldades com a ajuda de um profissional capaz de amparar seus passos na construção de uma maior estabilidade motora e perceptual.

A ótica dinâmica da motricidade prevê que qualquer aprendizagem de coordenação motora fina que mobilize efetores habituados a tarefas semelhantes, mas não idênticas, promova alguma forma de reorganização em que a construção do conhecimento novo se ampare no conhecimento velho. De fato, é o que ocorre na aquisição de língua estrangeira, como demonstra o artigo de Márcia Zimmer e Ubiratã Kickhöfel Alves, intitulado “Uma visão dinâmica da produção da fala em L2: o caso da dessonorização terminal”. Trata-se de um estudo da produção de oclusivas sonoras finais por cinco falantes nativos do inglês americano e quinze aprendizes brasileiros, divididos em dois grupos: proficiência intermediária e avançada. Opondo-se a uma literatura que afirma que o aprendiz brasileiro tende a ensurdecer as oclusivas do inglês em posição final, os autores mostram que o processo existe no inglês como L1, ainda que exiba gradientes distintos dos de L2. Comparados aos americanos, os brasileiros têm maior percentagem de ensurdecimento e maior duração da oclusão, juntamente com menor taxa de alongamento da vogal precedente. A interpretação oferecida é a de que a dificuldade reside na tendência do PB ao ritmo silábico: já que as nossas raras oclusivas de coda são sempre acompanhadas de uma breve vogal de apoio (como, p. ex., em ‘ra[pi]to’), o ensurdecimento parcial é uma estratégia para produzir uma oclusiva em antifase com a vogal precedente sem deixar muitas pistas da vogal de apoio no sinal acústico. A plausibilidade dessa hipótese é respaldada pela existência de átonas finais surdas em contextos semelhantes do PB. Por exemplo, MENESES (2012) apresenta evidências de que as vogais finais de palavras como ‘lance’ e ‘aço’ podem ensurdecer completamente, deixando rastros suficientes no ruído da fricativa precedente para inviabilizar a interpretação de apagamento.

Todos os artigos até agora comentados concernem a questões de coordenação local de gestos articulatórios que se prestam a testar o modelo da sílaba CV ou (C)VC de GOLDSTEIN et al. (2007a). Assim, será útil ao leitor saber que já existe uma ferramenta própria para testar hipóteses dessa natureza, contanto que se saiba como dar entrada nas especificações dos gestos articulatórios envolvidos. Trata-se do Task Dynamics Application (TaDA), software livre disponível para download no site do Laboratório Haskins (NAM & GOLDSTEIN, s.d.). A partir de graus e locais de constrição especificados junto com os respectivos timings, o programa calcula a evolução temporal da função de área de um modelo do trato vocal acoplado a uma saída acústica, i. e., funciona como um sintetizador articulatório controlado por parâmetros gestuais abstratos. Torna-se, assim, capaz de simular algumas das diferentes dinâmicas articulatórias que podem subjazer a um fenômeno fônico. Algumas dificuldades limitam, entretanto, as suas possibilidades de uso no momento: (1) a sua alimentação não é banal, exigindo extensas observações articulatórias a fim de produzir um input minimamente plausível; (2) as dinâmicas disponíveis para implementação automática são ainda muito simples; (3) apesar de possível, a programação específica para um experimento exige muitas horas de trabalho, mesmo para um programador experiente e familiarizado com a ferramenta. De qualquer maneira, a iniciativa dos pesquisadores de Haskins deve ser recebida com entusiasmo, pois aponta na direção de um futuro, acima apenas vislumbrado, no qual a experiência de análise de dados linguísticos de fonólogos e foneticistas, aliada à experiência computacional de cientistas cognitivos, deverá produzir grandes saltos no nosso entendimento da dinâmica fônica.

Todos os artigos até agora comentados envolvem processos fônicos que podem ser modelados pelo acoplamento de osciladores, no sentido horizontal, como na cadeia fônica, ou no sentido vertical, como na prosódia. Trata-se de interações mais ou menos locais entre tarefas articulatórias no âmbito da palavra, cuja dinâmica poderia, ao menos idealmente, ser modelada por uma ferramenta como o TaDA. Outra é, contudo, a temática dos dois últimos trabalhos, que se debruçam sobre interações entre itens lexicais na variação e na mudança linguísticas. Aqui, para viabilizar uma simulação, o mais recomendável seria uma abordagem por meio de sistemas adaptativos complexos. Nenhum dos dois textos pretende, todavia, ir além de defender análises linguísticas baseadas em conceitos da Dinâmica e indicar as vantagens do novo paradigma para a Fonologia.

O artigo de Thaïs Cristófaro-Silva, intitulado “Variabilidade em marcas fonológicas de plural no Português Brasileiro: uma análise baseada em Modelos de Uso”, oferece um tratamento da formação do plural no PB apoiado na Fonologia do Uso (BYBEE, 2001), modelo que incorpora a Teoria dos Exemplares (PIERREHUMBERT, 2000) na tentativa de dar conta de efeitos de frequência em fenômenos fônicos. A noção de uso é a mesma discutida acima a propósito da Lingüística Cognitiva. A Teoria dos Exemplares é, por sua vez, uma aplicação da ideia, anteriormente explorada pela Ciência Cognitiva em domínios como a visão, de que as categorias emergem a partir do uso e reuso de exemplares acumulados na memória. A evidência para tanto provém de experimentos de rememoração em que detalhes de um ou mais exemplares tiveram efeito no reconhecimento de categorias. Dado o surgimento recente da teoria, as suas hipóteses sobre a emergência e sedimentação das categorias são ainda um tanto nebulosas e bastante controversas (ROUDER & RATCLIFF, 2006). De qualquer modo, as noções de exemplar e de uso têm sido muito produtivas na Fonologia, principalmente como meios de incorporar dados de variação e mudança à discussão teórica das representações fônicas.

A tese da Fonologia do Uso mais explorada por Cristófaro- Silva é uma antiga e fértil reivindicação da Fonologia Natural (HOOPER, 1976) contra a Fonologia Gerativa, a saber: a de que o “componente” fonológico não é independente do resto da gramática. Assim, a rede de alomorfes de plural defendida pela autora não se baseia apenas na semelhança fônica: contempla também a relação associativa de todas as formas, inclusive as supletivas, com categorias gramaticais e semânticas. Isso permite uma reconstrução, a partir da forma sincrônica conservadora, da extensão ao plural do chamado morfema zero, o que simplifica a análise da sua posição no sintagma, bem como do uso do /s/ em outros constituintes. Em termos teóricos, persegue-se o objetivo de desproblematizar a alomorfia, mostrando que a variabilidade frequentemente encontrada nas línguas é esperada num modelo que pressuponha a multiplicidade e o dinamismo das representações fônicas.

É oportuno observar que alguns dos casos analisados pela autora poderiam ser modelados com uma rede neural recorrente, contanto que se pudesse configurar o input de acordo com a frequência de uso de cada um dos alomorfes. Outros casos – p.ex. nas exceções minoritárias – envolvem, contudo, a formação de uma subcategoria discreta, o que condiciona a possibilidade de simulação ao uso de redes complexas.

A coletânea fecha-se, finalmente, com um artigo meu, intitulado “Dinâmica sincrônica e diacrônica da deriva de abertura das vogais médias tônicas do Português”. Ele retoma e desenvolve, sob a ótica diacrônica, um antigo interesse pelas referidas vogais médias, especialmente no que toca ao papel do membro marcado do par, i.e., a vogal aberta (MAIA, 1981).

A meu ver, o principal enigma da história dessas vogais é a maneira como a distinção de abertura, reflexo da quantidade latina, teria se fortalecido no galego-português ao mesmo tempo em que se enfraquecia no resto do romance peninsular. Assim, o que denomino deriva de abertura é a tendência, observável na língua desde a Idade Média, a preferir a forma marcada, isto é, a vogal aberta, na maior parte do vocabulário novo. Para iluminar essa tendência, lanço mão de várias análises sincrônicas de frequência de ocorrência, com elas construindo um cenário em que o uso do vocabulário tem aspectos relativamente instáveis, dependentes de relações da língua com o meio social, ao lado de aspectos relativamente estáveis, dependentes de relações internas à própria língua. Enquanto os primeiros confirmam as previsões de ZIPF (1935) sobre o nível lexical baseadas nas noções de datação, lenição e desgaste semântico, os segundos confirmam as previsões de TRUBETZKOY (1957 [1939]) sobre o nível fônico baseadas nas noções de marca e carga funcional. É como se redes auto-organizadas de fones pudessem emergir no léxico, sem, contudo, estar ao abrigo das pressões por ele recebidas de fatores prosódicos e/ou mesmo não-fônicos. Chega-se, assim, a uma reconstrução histórica na qual a instalação e consolidação do acento intensivo em romance desempenha um papel crucial na origem da deriva de abertura.

Um aporte decisivo da abordagem dinâmica ao entendimento do problema é livrar a noção de marca da circularidade da sua definição estatística, permitindo-lhe sinalizar também certas ligações do sistema com elementos externos introduzidos pelo uso e pelas relações sociais. Assim, as vogais médias abertas estariam associadas a uma gama de sentidos relacionados não apenas à gramática, mas também a certos estratos lexicais, tais como os neologismos e os estrangeirismos.

Qualquer simulação razoavelmente realista dessa mudança, assim como da variação estudada por Cristófaro-Silva, envolveria um sistema adaptativo complexo, capaz de emular, ao mesmo tempo, a organização interna da língua e a influência do ambiente sobre ela. Tal influência, defendida décadas a fio pela voz solitária de Zipf, só agora começa a tornar-se mais compreensível para aqueles que – como eu – não aceitam abrir mão dos insights definitivos de Trubetzkoy sobre aquilo que poderíamos chamar, nos termos do novo paradigma, de atratores do inventário fônico enquanto sistema complexo (COUPÉ et al., 2009).

Conclusão

Chegamos assim ao fim da apresentação desta coletânea. Espero que esta introdução tenha tido sucesso em situar o/a leitor/a frente ao novo paradigma fornecendo-lhe suficientes ferramentas conceituais para o exame das contribuições a seguir. Boa leitura.

Referências

  1. A gestural solution for glide epenthesis problems ALBANO E. C. 1999;:1785-1788.
  2. O “Tear Encantado”, a Complexidade, a Tecnologia Digital e o Pensamento Interdisciplinar sobre a Linguagem ALBANO E. C. Remate de Males.2009;vol. 29(no. 1):41-57.
  3. O Gesto e suas bordas: esboço de Fonologia Acústico-Articulatória do Português Brasileiro ALBANO E. C. Campinas/São Paulo: Mercado de Letras/FAPESP; 2001.
  4. From Monkey-like Action Recognition to Human Language: An Evolutionary Framework for Neurolinguistics ARBIB M. A. Behavioral and Brain Sciences.2005;28(2):105-124.
  5. Agent-based modeling: Methods and techniques for simulating human systems BONABEAU E. Natural Academy of Sciences.2001;99(3):7280-7287.
  6. Articulatory gestures as phonological units BROWMAN C, GOLDSTEIN L. Phonology.1989;6:201-251.
  7. Articulatory Phonology: an overview BROWMAN C, GOLDSTEIN L. Phonetica.1992;49:155-180.
  8. Phonology and Language Use BYBEE Joan. Cambridge: Cambridge University Press; 2001.
  9. Mirror neurons and the evolution of language CORBALLIS M. C. Bain & Language.2010;112(1):25-35.
  10. Structural complexity of phonological systems COUPÉ C, MARISCO E, PELLEGRINO F. In: PELLEGRINO F, MARISCO E, CHITORAN I, COUPÉ C, eds. Approaches to phonological complexity. Berlin/New York: Mouton de Gruyter; 2009 .
  11. Cognitive Linguistics CROFT W, CRUSE D. A. Cambridge: Cambridge University Press; 2004.
  12. Evolution and self-organisation in vowel systems DE BOER B. Evolution of Communication.1999;3(1):79-102.
  13. Dynamical systems and cognitive linguistics: toward an active morphodynamical semantics DOURSAT R, PETITOT J. Neural Networks.2005;18:628-638.
  14. Distributed representations, simple recurrent networks, and grammatical structure ELMAN J. L. Machine Learning.1991;7:195-224.
  15. Dynamic action units slip in speech production errors GOLDSTEIN, L, POUPLIER, M, CHEN L, SALTZMAN E, BYRD D. Cognition.2007a;103:386-412.
  16. The role of vocal tract gestural action units in understanding the evolution of phonology GOLDSTEIN L, BYRD D, SALTZMAN E. In: ARBIB M, ed. Action to Language via the Mirror Neuron System. Cambridge: Cambridge University Press; 2006 .
  17. Syllable structure as coupled oscillator modes: evidence from Georgian vs. Tashlhiyt Berber GOLDSTEIN L, CHITORAN I, SELKIRK E. In: Proceedings of the XVIth International Congress of Phonetic Sciences. Saarbrücken 2007 .
  18. Coupled oscillator planning model of speech timing and syllable structure GOLDSTEIN L, NAM H, SALTZMAN E, CHITORAN I. In: FANT G, FUJISAKI H, SHEN J, eds. Frontiers in Phonetics and Speech Science. Beijing: The Commercial Press; 2009 .
  19. The Organization of Behaviour HEBB D. O. John Wiley & Sons; 1949.
  20. Complex Adaptive Systems Daedalus. A New Era in Computation HOLLAND John H. The MIT Press.1992;vol. 121(No. 1):17-30.
  21. An Introduction to Natural Generative Phonology HOOPER J. B. New York: Academic Press; 1976.
  22. Dynamic patterns: the self-organization of brain and behavior KELSO J. A. S. Cambridge: MIT PRESS; 1995.
  23. The structure of scientific revolutions KUHN T. S. Chicago: Chicago University Press; 1962.
  24. Sounds of the World’s Languages LADEFOGED P, MADDIESON I. Oxford: Blackwell; 1996.
  25. PatPho: a phonological pattern generator for neural networks. LI P, MACWHINNEY B. Behavioral Research Methods, Instruments, & Computaters.2002;34(3):408-415.
  26. Phonological and lexical processes in a generative grammar of Portuguese MAIA E. A. M. 1981.
  27. As vogais desvozeadas no português brasileiro: investigação acústico-articulatória MENESES F. 2012.
  28. TADA (TAsk Dynamics Application) manual NAM H, GOLDSTEIN L. .
  29. Modeling and evaluating summaries using complex networks PARDO T. A. S, ANTIQUERA L, NUNES M. D. V, OLIVEIRA JR. O. M, COSTA L. D. Lecture Notes in Artificial Intelligence.2006;3960:1-10.
  30. Exemplar dynamics: Word frequency, lenition and contrast PIERREHUMBERT J. In: BYBEE J, HOPPER P, eds. Frequency and the emergence of linguistic structure. Amsterdam: John Benjamins; 2000 .
  31. How are words stored in memory? Beyond phones and phonemes PORT R. New Ideas in Psychology.2007;vol. 25':143-170.
  32. Mind as Motion PORT R, Van GELDER T. MIT Press; 1995.
  33. Comparing Exemplar and Rule-Based Theories of Categorization ROUDER J, RATCLIFF R. Current Directions in Psychological Science.2006;15(1):9-13.
  34. Nonlinear Dynamics and Chaos: with applications to physics, biology, chemistry, and engineering STROGATZ S. H. Reading, MA: Addison-Wesley Publishing Co.; 1994.
  35. Time-scale dynamics and the development of an embodied cognition THELEN E. In: PORT R, van GELDER T, eds. Mind as motion: explorations in the dynamics of cognition. Cambridge: MIT Press; 1995 .
  36. A dynamic systems approach to the development of cognition and action THELEN E, SMITH L. B.. Cambridge, MA: MIT Press; 1994.
  37. Principes de Phonologie TRUBETZKOY N. S. Paris: Klincksieck; 1957 [1939].
  38. Gestalt Theory WERTHEIMER Max. Hayes Burton; 1900.
  39. The Psycho-Biology of Language: An Introduction to Dynamic Philology ZIPF G. K. New York: Houghton-Mifflin; 1935.
  40. The Psychobiology of Language ZIPF G. K. Boston: Houghton-Mifflin; 1935.