A cena, já presenciada por muitos, de a criança repetir inconformada: -"Eu não disse x, eu disse x" – na verdade, para a criança, y – remete-nos à seguinte questão: a ilusão da distinção fônica (ou da falta dela) deve ser atribuída à criança ou aos ouvintes?
Para tentar responder a esta questão, debrucemo-nos sobre a produção de fala de uma criança que, durante o chamado processo típico de aquisição da linguagem, apresenta uma tendência à anteriorização dos sons da fala. Ressalta-se que esta tendência, além de ser muito frequente na fala das crianças, pode, também, ser considerada típica até certo momento da aquisição da linguagem.
Para ilustrarmos esse processo de anteriorização, tomemos como exemplo as chamadas substituições entre as oclusivas surdas velares e as oclusivas surdas alveolares, presentes, por exemplo, na produção de [t]avalo para [k]avalo.
Neste caso, podemos ilustrar a seguinte situação:
Uma criança, aos 2 anos e 10 meses de idade, brinca tranquilamente com uma miniatura de um cavalo, quando é interrompida por um adulto que lhe questiona:
(Adulto) – “O que você está fazendo?”
(Criança) – “Tô bintanto com o tavalo”.
(Adulto) – “Ah, com o tavalo?”.
(Criança) – “Não! Com o tavalo. Esse ati ó (criança mostra ao adulto a miniatura do cavalo), o meu tavalo”.
Uma possível interpretação para esta situação seria assumir que, embora a criança possa perceber a distinção entre as oclusivas na fala do adulto – marcada pela sua indignação frente à imitação errada –, não perceberia a distinção entre as oclusivas surdas velar e alveolar em sua própria fala. Desse modo, a não percepção em sua própria fala – marcada pela repetição de sua produção não típica – poderia indiciar que a criança não apresenta a aquisição efetiva desse contraste fônico.
De outra perspectiva, poderíamos entender que a criança além de perceber a distinção entre as oclusivas na fala do adulto, também poderia estar apresentando uma distinção entre esses sons em sua própria fala – marcada na produção do som em sua repetição, juntamente com a demonstração da miniatura frente à não compreensão do adulto –, mas esta distinção não seria efetiva o suficiente para que o adulto pudesse resgatá-la auditivamente.
A múltipla explicação para a ocorrência desse fenômeno na aquisição da linguagem nos remete ao modelo teórico adotado na interpretação e, consequentemente, à concepção de representação fonológica.
A seguir, apresentaremos, primeiramente, as diversas interpretações para essa tendência à anteriorização, a partir de modelos teóricos clássicos baseados no paradigma cognitivo simbólico, os quais têm considerado a existência do segmento enquanto representação categórica e a decorrente atribuição de processos – formalizados pela atuação de regras e/ou restrições – na interpretação das produções de fala das crianças.
Adiante, descreveremos outras interpretações para este mesmo fenômeno a partir de modelos teóricos baseados no paradigma cognitivo dinâmico, os quais não somente têm considerado diferentes unidades representacionais, como também apresentam outra concepção para o que se entende por representação.
Nos modelos teóricos clássicos baseados no paradigma cognitivo simbólico, responsáveis por grande parte dos estudos que se ocupam da aquisição típica e/ou desviante da linguagem, a representação fonológica é vista de forma categórica, ainda que sua aquisição possa ser compreendida como um processo gradual, na medida em que a criança pode oscilar entre percentuais altos e baixos de produção correta – padrão referido como curva em U e reportado de forma recorrente nos estudos em aquisição fonológica do português (LAMPRECHT
Um exemplo de modelo teórico no interior do paradigma simbólico é a Fonologia Natural, proposta por STAMPE (1973). Neste modelo, a criança apresenta uma tendência à simplificação, via aplicação de processos fonológicos, que é inerente à sua fala. Essa tendência à simplificação é motivada por limitações físicas, na medida em que visa a diminuir as dificuldades articulatórias das crianças. Os processos fonológicos são, então, formalizados pela aplicação de regras.
Em nosso exemplo, a tendência à anteriorização da obstruinte velar surda é explicada pelo
A formalização deste processo fonológico pode ser assim representada: /k/ à [t].
Outro modelo teórico que podemos mencionar, com base no paradigma cognitivo simbólico, é a Fonologia Gerativa, proposta por CHOMSKY & HALLE (1968).
Neste modelo teórico, a aquisição fonológica se dá pelo desenvolvimento gradual das regras que atuam em cada sistema linguístico, a partir de operações mentais que utilizam traços distintivos. Todo falante possui, pois, uma representação fonológica e uma representação fonética. A primeira aproxima- se da representação mental que os falantes têm dos itens lexicais, constituindo o que CHOMSKY (1968) denominou de estrutura subjacente; enquanto a segunda aproxima-se da chamada representação de superfície, isto é, da forma fonética efetivamente realizada.
Sendo a Fonologia Gerativa Clássica um modelo teórico derivacional, a relação entre os dois tipos de representação (fonológica e fonética) é estabelecida por meio da aplicação de regras.
Com efeito, as crianças em processo de aquisição fonológica aprendem regras para combinar traços e classes de traços para formar novos fonemas (CROCKER, 1969). Adicionalmente, a ocorrência dos “erros” de produção de fala é determinada por padrões ou regras de combinação envolvendo os traços distintivos.
Assim sendo, em nosso exemplo, a tendência à anteriorização da obstruinte velar poderia ser explicada devido a duas possibilidades:
(i) Substituição de traços distintivos Ex: [ka’valu] – [ta’valu]
Substituição dos traços distintivos [-anterior], [-coronal] para [+anterior], [+coronal];
(ii) Assimilação de traços distintivos Ex: [pe’tεkɐ] – [pe’tεtɐ].
Neste exemplo, entende-se que /k/ copia os traços de /t/ ([+anterior], [+coronal]), tornando-se igual a ele.
Outro modelo teórico, também de base gerativista, muito aplicado à análise dos dados em aquisição da fonologia, é a Geometria de Traços de CLEMENTS & HUME (1995).
Com base nesta teoria, a aquisição é vista como uma associação de traços ainda não ligados à estrutura do segmento: a criança vai formando o segmento aos poucos, por meio da associação de novos traços, seguindo a direção do não marcado para o marcado. A proposta tenta explicar a realização de formas variáveis – por exemplo, [ka’valo] ~ [ta’valo] – pela possibilidade de se considerar a associação de dois valores de traços a um determinado nó
Nesta perspectiva, a tendência à anteriorização das obstruintes velares pode ser explicada devido a três possibilidades:
(i) Substituição de traços distintivos. Ex: [ka’valu] – [ta’valu]
Substituição do traço distintivo, pelo desligamento do traço [dorsal] e a inserção do traço
(ii) Assimilação de traços distintivos (cópia de traços de um segmento para outro)
Ex: [pe’tεkɐ] – [pe’tεtɐ].
Cópia de traços de /t/ para /k/, com o desligamento de [dorsal] e o espraiamento de [coronal].
(iii) Construção gradual do segmento Ex: [ka’valu] – [ta’valu]
Inserção do traço
Sem apresentar um viés teórico estritamente gerativista, mas ainda considerando alguns de seus pressupostos, como a representação subjacente e a Gramática Universal, a Teoria da Otimidade (PRINCE & SMOLENSKY, 1993) – com base em princípios gerativistas e conexionistas – entende que o processo de aquisição fonológica ocorre pelo reordenamento de restrições que constituem a hierarquia do aprendiz, de forma a suprimir as deficiências perceptuais e articulatórias que ainda não permitem que a criança tenha uma forma ideal de
A aquisição fonológica se dá pela construção gradual da hierarquia de restrições alvo a ser atingida, por sucessivos movimentos de promoção e demoção de restrições, desencadeados pela aplicação de algoritmos de aprendizagem (TESAR & SMOLENSKY, 2000; BOERSMA & HAYES, 2001). É, justamente, por meio da aplicação dos algoritmos, que a Teoria da Otimidade, ao contrário dos modelos teóricos formais que a precederam, possibilita a formalização da variabilidade de produção encontrada no percurso de aquisição da fonologia, tanto no que se refere à variação intrassujeito quanto à variação intersujeitos.
Nesse sentido, a teoria tem sido aplicada, de maneira profícua, não apenas para o processo de construção gradual do sistema fonológico pelo aprendiz, mas também para explicitar a coexistência de formas variáveis que ocorrem na língua do adulto, o que está diretamente ligado a questões relativas à mudança linguística. É importante salientar que a teoria explica, com o mesmo aparato teórico, a variação encontrada nos dados de aquisição e na fala do adulto, ou seja, por meio de valores instáveis de determinadas restrições que constituem as hierarquias, podendo originar ordenamentos diferenciados em momentos distintos de processamento (BONILHA, 2004).
Seguindo, no entanto, outros modelos teóricos, a Teoria da Otimidade continua a explicar a tendência à anteriorização das obstruintes velares pelas crianças como um processo fonológico. A diferença, no entanto, é que a formalização é explicitada não mais pela aplicação de regras – tendo em vista que a OT pressupõe o processamento em paralelo –, mas pela atuação de um conjunto de restrições hierarquizadas.
Assim, nesta perspectiva, a anteriorização das obstruintes velares pode ser explicada por duas possibilidades:
(i) Substituição de traços distintivos.
Ex: [ka’valu] – [ta’valu]
Substituição do traço distintivo, pela violação das restrições *[coronal] e Ident, dispostas no seguinte ordenamento na hierarquia do aprendiz: *[dorsal] >> Ident >> *[coronal]
(ii) Assimilação de traços distintivos (cópia de traços de um segmento para outro)
Ex: [pe’tεkɐ] – [pe’tεtɐ].
/k/ copia os traços de /t/, com a violação das restrições Ident, Agree e *[coronal], dispostas no seguinte ordenamento na hierarquia do aprendiz: *[dorsal] >> Ident >> Agree >> *[coronal].
A ocorrência do processo é explicada basicamente pelo alto ordenamento da restrição de marcação *[dorsal] em relação a restrições de fidelidade e o baixo ordenamento da restrição *[coronal], como podemos constatar em trabalhos como BERNHARDT & STEMBERGER (1998) e BARLOW & GIERUT (1999). No percurso da aquisição, as hierarquias de restrições evidenciadas pelas crianças sofreriam alterações até atingir o ordenamento disposto na gramática do adulto, Max, Ident, Agree >> *[dorsal] >> *[coronal], o qual não permite mais a realização do processo de anteriorização.
Com base, pois, no exame da Fonologia Natural, do modelo de traços de CHOMSKY & HALLE (1968), da Geometria de Traços e da Teoria da Otimidade, podemos identificar claramente que o processo de anteriorização é entendido como a não representação efetiva do segmento a ser produzido, ou seja, neste caso, a oclusiva velar surda /k/.
No entanto, podemos, ainda, levantar algumas questões em relação às múltiplas interpretações dadas ao fenômeno de anteriorização: (i) na medida em que estes modelos baseiam-se primordialmente numa análise de oitiva, haveria uma verdadeira neutralização do contraste fonológico na fala da criança? (ii) em caso de não existir uma verdadeira neutralização do contraste fonológico na fala da criança, será que o detalhe fonético estaria apenas relacionado à representação fonética, não tendo relação com a representação fonológica?
Na tentativa de responder essas questões, apresentaremos algumas interpretações para o mesmo fenômeno a partir de modelos teóricos baseados no paradigma cognitivo dinâmico, os quais não somente têm considerado outra unidade de representação simbólica, como também apresentam outra concepção para o que se entende como representação.
Passaremos a apresentar uma interpretação gestual para o exemplo descrito no início deste capítulo, a partir do paradigma cognitivo dinâmico.
Para tanto, utilizaremos como referência a investigação conduzida por BERTI (2009) acerca do processo de estabelecimento do contraste entre /t/ e /k/ no contexto das vogais /a/ e /u/, em três crianças do sexo masculino, com idade média de 35,33 meses (e desvio padrão de 1,88), em processo típico de aquisição da linguagem.
O estímulo utilizado no experimento de produção foi constituído por palavras dissílabas paroxítonas que combinavam as oclusivas /t/ e /k/ com as vogais /a/ e /u/ na posição acentuada (“taco”, “caco”, “tuba” e “cuba”). Foi excluído o contexto da vogal /i/ pelo fato de o /t/ ser produzido como africada diante dessa vogal na região onde foi desenvolvida a pesquisa.
Cada criança foi gravada numa cabine acústica instalada no interior da EMEI com gravador digital Marantz modelo PMD 670 acoplado a um microfone cardióide dinâmico SHURE modelo 8800. Utilizou-se para análise dos dados o software PRAAT 5.0.30 e para análise estatística o software STATISTICA versão 6.0.
Os critérios de inclusão das crianças na amostra foram: a) desenvolvimento típico de linguagem; b) ausência de alterações neurológicas, auditivas e de estruturas orofaciais, e c) presença do processo de anteriorização das obstruintes. Aos responsáveis, foi solicitada a assinatura do termo de consentimento livre e esclarecido.
O procedimento experimental consistiu em solicitar das crianças cinco repetições de cada uma das palavras no interior da seguinte frase veículo: “Fale
Para a investigação do estabelecimento do contraste entre /t/ e /k/, BERTI (2009) realizou tanto uma análise perceptivo- auditiva – 60 ocorrências resultantes das gravações das produções dessas crianças (2 consoantes x 2 vogais x 5 repetições x 3 crianças = 60 produções) –, quanto uma análise acústica das produções julgadas como substituídas e/ou distorcidas.
A análise perceptivo-auditiva foi feita por um foneticista com base nas gravações em áudio das produções das crianças. O foneticista transcreveu as produções como corretas e incorretas, tendo em vista a produção alvo das oclusivas /t/ e/ k/. Adicionalmente, todas as produções transcritas como incorretas foram caracterizadas como erros de omissão, substituição ou distorção das oclusivas. Após um mês da data da transcrição, o mesmo foneticista transcreveu todos os dados novamente. A partir de uma análise de concordância intrassujeito, obteve-se uma porcentagem de concordância de 95% (57/60).
A análise acústica das produções julgadas como substituídas, por sua vez, foi feita com base nos seguintes parâmetros acústicos: (1) inspeção acústica da forma de onda; (2) características espectrais do estouro: pico espectral e momentos espectrais
A definição dos parâmetros acústicos bem como seu correlato articulatório são sintetizados no Quadro 1:
Foi realizada uma análise estatística a partir da ANOVA One-Way para cada uma das crianças, separadamente. Os fatores intrassujeitos foram oclusivas (/t/ e /k/) e as variáveis dependentes foram os oito parâmetros acústicos adotados na análise: pico espectral, centróide, variância, assimetria, curtose, frequência de Locus de F2, medida de duração da closura e medida da duração do estouro. Após a ANOVA One-Way, foi utilizado o Modelo Linear Hierárquico, proposto por RAUDENBUSH
Foram considerados estatisticamente significativos os resultados com valores de p inferiores a 0,05 (p < 0,05) e marginais os resultados com valores de p entre 0,05 e 0,1(0,05 < p < 0,1).
Os resultados da análise perceptivo-auditiva obtidos por BERTI (2009) estão expostos nas Tabelas 1 e 2, conforme o contexto vocálico.
Com base nos resultados dispostos nas tabelas, constata-se uma grande flutuação nas produções das crianças na tentativa de estabelecer o contraste entre /t/ e /k/. Ou seja, observamos, concomitantemente a produções típicas, substituições dos dois segmentos – tanto posteriorização do /t/, quanto anteriorização do /k/ –, bem como distorção de /k/.
São constatados casos de variação intrassujeito, a saber, as produções de C1 e C2 em relação ao alvo /t/, com ocorrências de produções típicas e de substituições, e casos de variação intersujeitos, com a tendência à anteriorização – recorrente processo da aquisição fonológica nas línguas do mundo – constada nos dados de C3, e a tendência à posteriorização, nos dados de C1 e C2.
Quanto ao papel do contexto vocálico, esse parece ser relevante apenas em relação à emergência de /t/, pois C1 e C2 não atingem a forma alvo quando /t/ antecede a vogal /a/, mas apresentam produções variáveis quando o contexto envolve a vogal /u/. Já para /k/, as produções típicas produzidas por C1 e C2 ocorrem nos contextos de /a/ e de /u/ e, para C3, não ocorrem nos dois contextos, o que minimiza o papel do contexto vocálico em relação à oclusiva posterior.
Quanto aos resultados obtidos na análise acústica, BERTI (2009, 2010) detectou, na inspeção acústica da forma de onda, um fenômeno descrito como sendo estouros duplos, isto é, a presença de dois transientes acústicos, geralmente com amplitudes distintas e com durações extremamente reduzidas. Os estouros duplos foram detectados tanto em produções julgadas como típicas quanto em produções julgadas como substituições. As Tabelas 3 e 4 sintetizam esses achados:
No contexto da vogal /a/, constatamos estouros duplos em algumas produções apenas da criança C1. Particularmente, identificamos os estouros duplos em 3 ocorrências (60%) de substituições, produção apreendida auditivamente como sendo
/t/→[k], e em uma ocorrência típica de /k/ (20%).
Diferentemente, no contexto da vogal /u/, detectamos a presença de estouros duplos em algumas produções das três crianças. Especificamente, identificamos os estouros duplos em 1 produção julgada como típica de /t/ (20%), em 5 produções julgadas como típicas de /k/ (50%), além das 3 (100%) ocorrências de substituição, produção apreendida auditivamente como sendo /t/→ [k].
As Figuras 1 e 2 ilustram a presença de estouros duplos no contexto da vogal /a/ de C1:
Uma vez identificada a presença de estouros duplos, BERTI (2009) realizou, ainda, uma análise espectral de cada um dos estouros, objetivando identificar o maior pico de energia dado pelo espectro. A autora descreve que os valores obtidos no pico de cada um dos estouros foram bem semelhantes. O valor do pico espectral do primeiro estouro na produção apreendida como sendo uma substituição de /t/à[k], por exemplo, apontou para características acústicas sugestivas de um /k/ (1613 Hz), assim como o valor do pico do segundo estouro também é sugestivo de características acústicas do mesmo segmento (1583 Hz). As Figuras 3 e 4 ilustram esses achados.
Nas Figuras 3 e 4, destaca-se que a frequência do gráfico espectral varia de 0 a 11025 Hz. A autora ressalta que essa tendência – características espectrais semelhantes nos estouros duplos – foi observada na análise espectral de todas as ocorrências desse fenômeno, sugerindo o uso de um mesmo articulador.
Os resultados obtidos nos demais parâmetros acústicos considerados nas análises de BERTI (2009) são apresentados detalhadamente nas Tabelas 5 e 6:
***:p<0,001; **:p<0,01; *:p<0,05; _: p marginal: 0,05 < p < 0,1.
Legenda: C = criança; M1 = centróide (Hz); M2 = variância (MHz); M3 = assimetria; M4 = curtose.
***:p<0,001; **:p<0,01; *:p<0,05; _: p marginal: 0,05 < p < 0,1
Legenda: C= criança; M1= centróide (Hz); M2= variância(MHz); M3 = assimetria; M4 = curtose.
Considerando os resultados expostos na Tabela 5, observa- se, no contexto da vogal /a/, que as crianças C1 e C3 apresentaram uma distinção fônica entre /t/ e /k/ com o uso de pelo menos um parâmetro acústico (assimetria e % de closura, no caso de C1, e pico espectral, no caso de C3). Diferentemente, a criança C2 não apresentou qualquer distinção entre /t/ e /k/, na medida em que nenhum parâmetro acústico apresentou significância estatística apontando para tal distinção fônica.
Por outro lado, conforme os resultados descritos na Tabela 6, nota-se que as três crianças apresentaram uma distinção entre /t/ e /k/ no contexto da vogal /u/, pois, nas produções das três crianças, constatou-se pelo menos um parâmetro acústico – seja ele relacionado às características espectrais, de transição formântica e/ou às características temporais – que conseguiu distinguir as oclusivas surdas alveolar e velar.
O critério geralmente aceito na literatura para considerarmos que um determinado contraste fônico foi efetivamente adquirido pela criança é de 75% de acerto em uma posição particular da sílaba (TEMPLIN, 1957). BERTI (2009) usou esse mesmo critério (75%) em relação aos parâmetros acústicos utilizados para marcar uma distinção fônica. Ou seja, quando a criança utilizava pelo menos 75% dos parâmetros acústicos adotados, considerou que a criança adquiriu efetivamente o contraste fônico entre /t/e /k/. Caso contrário, a produção era classificada da seguinte forma: (a) substituição categórica, quando não havia distinção em nenhum dos parâmetros adotados; (b) contraste encoberto
Com efeito, a interpretação dada por BERTI (2009), ao observar os resultados expostos nas Tabelas 5 e 6, é a de que as crianças em processo de aquisição do contraste entre /t /e /k/ apresentaram tanto substituições categóricas quanto contrastes encobertos.
A autora verificou que – no contexto da vogal /a/ – duas das três crianças apresentaram contrastes encobertos, ou seja, utilizaram pelo menos um parâmetro acústico para distinguir as oclusivas /t/ e /k/, embora tais produções tenham sido caracterizadas auditivamente como substituições categóricas. Analogamente, no contexto da vogal /u/, as três crianças apresentaram contrastes encobertos, apesar de 8 substituições terem sido descritas como categóricas auditivamente (3 substituições de /t/à[k] e 5 substituições de /k/à[t]).
Ainda em relação aos parâmetros acústicos adotados, BERTI (2009) apontou para o fato de que as crianças investigadas iniciam, de forma geral, o processo de distinção entre as duas oclusivas a partir das seguintes pistas acústicas, preferencialmente: pico espectral, transição de F2 e % de closura, ou seja, tanto pistas relativas às características espectrais quanto às características temporais.
Em síntese, conforme as considerações feitas pela autora, apesar de todas as substituições entre /t/ e /k/ serem interpretadas como categóricas pela análise perceptivo-auditiva, verifica-se, a partir da análise acústica, que grande parte dessas produções constitui, na verdade, contrastes encobertos, na medida em que as crianças compartilham vários, mas não todos, parâmetros fonético-acústicos relevantes para o estabelecimento do contraste entre as oclusivas velar e alveolar surdas.
O conjunto dos resultados obtidos por BERTI (2009), ao indicar, mais uma vez, a presença de contrastes encobertos nas produções das crianças, conduz, pois, a uma interpretação gestual para explicitar a aquisição da fonologia. Os modelos teóricos referidos anteriormente são capazes, apenas, de formalizar a emergência de contrastes categóricos, mesmo se considerados os enfoques não estritamente gerativos, como a Teoria da Otimidade. Esta apresenta, sem dúvida, dentre os modelos referidos, um maior potencial para a formalização dos contrastes encobertos, mas necessita de substanciais reformulações em relação aos primitivos representacionais e à configuração das restrições que constituem as diferentes hierarquias das línguas
Na próxima seção, buscamos, então, explicar os resultados expostos à luz de um modelo dinâmico de produção de fala, tal como a Fonologia Gestual (doravante FonGest).
A FonGest adota como primitivo de análise o gesto articulatório, definido como uma unidade fonético-fonológica por excelência, ou seja, é uma “oscilação abstrata que especifica constrições no trato vocal e induz os movimentos dos articuladores” (ALBANO, 2001: 52). Desse modo, gestos articulatórios servem, simultaneamente, como unidades de ação (formação de constrição) e de informação (codificando contraste).
Destaca-se, pois, que os gestos articulatórios não correspondem a movimentos individuais dos articuladores, mas sim às ações de constrição de diferentes órgãos do trato vocal designados de
Assume-se, nessa abordagem, que os gestos articulatórios (unidades atômicas) se combinam sistematicamente para formar estruturas maiores, tal como os segmentos e as sílabas (unidades “moleculares”). No entanto, essa combinação gestual se dá de um modo mais elaborado do que simples sequências lineares, permitindo, consequentemente, que haja uma sobreposição entre eles no tempo. As sílabas, então, são consideradas constelações de múltiplos gestos acoplados com determinados graus de coordenação intergestual (GOLDSTEIN & FOWLER, 2003; GOLDSTEIN, BYRD & SALTZMAN, 2006).
A coordenação intergestual das sílabas pode ser obtida especificando a relação de fase (ou
Baseando-se nos princípios do modelo dinâmico de osciladores acoplados, proposto por SALTZMAN & BYRD (2000) e posteriormente estendido por NAM & SALTZMAN (2003), a versão atual do modelo da FonGest preconiza que cada gesto articulatório está associado a um oscilador (não linear) próprio, e a coordenação temporal entre os gestos se dá pelo acoplamento desses osciladores. Há, fundamentalmente, três aspectos do acoplamento de osciladores que parecem ser relevantes para o
Esquematicamente, as moléculas gestuais (correspondendo a segmentos ou sílabas) são representadas usando um gráfico de acoplamento em que os pontos representam os gestos articulatórios e as linhas (contínuas e pontilhadas) que ligam esses pontos representam o modo de acoplamento intergestual, conforme a Figura 5.
Na Figura 5, as linhas indicam as relações de acoplamento entre os gestos, sendo que a linha sólida indica acoplamento de gestos em fase (sincrônico) e a linha pontilhada indica acoplamento de gestos em antifase. Como pode ser observado, os gestos de ponta da língua (TT) e de abertura glótica para a produção da fricativa, por exemplo, são acoplados de modo sincrônico (em fase – 0°) com o gesto de corpo da língua (TB) para a produção da vogal, enquanto os gestos de ponta da língua e fechamento labial são acoplados entre si em antifase - 180°.
Destaca-se, ainda, que, embora um conjunto de osciladores não lineares coordenados contenham vários modos estáveis de acoplamento (PIKOVSKY
Essa informação acerca dos modos mais estáveis de acoplamento intergestual torna-se importante pelo fato de se hipotetizar que os sistemas fonológicos utilizam, preferencialmente, os modos de acoplamento gestuais mais estáveis e, ainda, que a criança, ao adquirir o sistema fonológico de sua língua, tira partido desses modos mais estáveis para começar a coordenar múltiplas ações na fala (GOLDSTEIN, BYRD & SALTZMAN, 2006).
Na medida em que os gestos articulatórios têm uma estrutura temporal intrínseca e uma magnitude de ativação, há a possibilidade de os gestos se sobreporem ou serem ativados parcialmente durante a produção de fala. A magnitude da sobreposição entre os gestos bem como sua magnitude de ativação, porém, são dependentes de vários fatores, tais como: velocidade de fala (taxa de elocução), estilo (casual x formal) e tipo de órgãos utilizados para realizar a constrição e marcar um contraste linguístico (GOLDSTEIN & FOWLER, 2003).
Alguns estudos, tais como o de BROWMAN & GOLDSTEIN (1990), por exemplo, têm mostrado como a sobreposição gestual na fala casual pode ser usada para explicar eventos como assimilação, apagamento e inserção de segmentos, tradicionalmente explicados pela aplicação de regras fonológicas. Mais recentemente, a abordagem gestual, explorando os diferentes modos pelos quais os gestos se sobrepõem no tempo ou diferentes magnitudes de ativação, tem sido ampliada para analisar e explicar não somente a ocorrência de erros na produção fala de falantes adultos típicos (GOLDSTEIN, POUPLIER, CHEN, SALTZMAN & BYRD, 2007), falantes adultos com alterações de fala (POUPLIER & HARDCASTLE, 2005), crianças com alterações de fala (VAN LIESHOUT & GOLDSTEIN, 2008), como também a consequência perceptual desses erros (POUPLIER & GOLDSTEIN, 2005).
GOLDSTEIN
Especificamente, os erros de intrusão gestual foram definidos quando o gesto intencionado co-ocorria ou era coproduzido com um gesto da consoante conflitante. Por exemplo, num erro transcrito como sendo uma ocorrência de substituição de /t/ por [k] (“cop cop” ao invés de “cop top”), observou-se a coprodução de um gesto de ponta de língua e um gesto de dorso de língua. Erros intrusivos foram relatados pelos autores desse estudo como sendo os mais frequentes (28,2%). Adicionalmente, os gestos intrusivos variaram o grau de constrição ou sua magnitude de ativação, influenciando o modo pelo qual eles foram percebidos (POUPLIER & GOLDSTEIN, 2005).
Erros de redução gestual, por sua vez, foram definidos quando a magnitude do gesto intencionado era reduzida. Esse tipo de erro apresentou a menor frequência de ocorrência (3,3%). Finalmente, os erros de intrusão gestual concomitante à redução gestual foram também designados como verdadeiras substituições, na medida em que o gesto da consoante alvo se reduz concomitante à intrusão do gesto da consoante conflitante. A frequência desse tipo de errou foi de 4,3% (GOLDSTEIN, POUPLIER, CHEN, SALTZMAN & BYRD, 2007: 394).
Como hipótese explicativa para a ocorrência de erros de gestos intrusivos, os autores propuseram que eles sejam causados pela sincronização rítmica (também chamada de
Nesse sentido, GOLDSTEIN e colegas (2007) explicam que tanto o gesto de ponta de língua na produção de /t/ em “top”, quanto o gesto de corpo de língua na produção de /k/ em “cop” se acoplam em antifase (2:1) com o gesto labial na produção de /p/, modo de acoplamento menos estável (NAM & SALTZMAN, 2003). A presença do gesto intrusivo corrige esta situação, produzindo um modo mais estável (harmônico) de acoplamento entre os gestos de ponta de língua, dorso e lábios. A Figura 6 ilustra a ocorrência do gesto intrusivo:
Contudo, os erros de produção de fala podem ser vistos como sendo o resultado de uma inter-relação (tensão) entre contrastes específicos da língua e princípios dinâmicos da coordenação de movimentos em geral (POUPLIER & HARDCASTLE, 2005).
Adicionalmente, os mesmos autores complementam a descrição dos erros numa perspectiva gestual afirmando que
.
Gradient properties of errors are part of the critical fluctuations that typically accompany spontaneous transitions between different coordination modes. The entrainment view of errors predicts that coproduction and gradient errors will be observed no matter where in the production process errors arise; there is no dichotomy between ‘phonological’, well-formed and ‘phonetic’, ill-formed errors (POUPLIER & HARDCASTLE, 2005: 239).
.
Estudos mais recentes (VAN LIESHOUT & GOLDSTEIN, 2008) têm explorado uma interpretação dinâmica para os erros produzidos por crianças com alterações de fala.
Destacaremos, particularmente, a interpretação conduzida por VAN LIESHOUT & GOLDSTEIN (2008), pelo fato de esses autores apresentarem estudos envolvendo diferentes questões de coordenação, a saber: a) coordenação entre articuladores individuais (acoplamento intragestual); b) coordenação entre gestos individuais (acoplamento intergestual); e c) intrusão gestual.
Para exemplificar problemas de acoplamento intragestual, VAN LIESHOUT & GOLDSTEIN (2008) baseiam-se nos estudos de WARD (1997) e CHANG
No segundo estudo, CHANG
VAN LIESHOUT & GOLDSTEIN (2008) interpretaram essa falta de diferenciação entre labiais e alveolares devido, possivelmente, a um problema de coordenação intragestual. A mandíbula é um articulador que participa da sinergia funcional (ações coordenadas) tanto com os lábios quanto com a língua. Se a coordenação entre lábios e mandíbula for problemática (tal como apontam os resultados de WANG), de tal modo que a tarefa alvo é atingida pela contribuição principal do movimento da mandíbula, então, uma grande diminuição, tanto da abertura labial, quanto da distância entre a ponta de língua e o palato, deverá ocorrer durante a produção das coronais e labiais, respectivamente. A consequência acústica é uma maior similaridade entre coronais e labiais, quando comparada às produções dos sujeitos controles.
Para exemplificar problemas de acoplamento intergestual, VAN LIESHOUT & GOLDSTEIN (2008) baseiam-se nos resultados descritos por TJADEN (2000,
Finalmente, para exemplificar erros de intrusão gestual, VAN LIESHOUT & GOLDSTEIN (2008) remetem à revisão realizada por POUPLIER & HARDCASTLE (2005), comparando vários estudos articulatórios em paciente com afasia e apraxia de fala. A conclusão destes últimos autores foi a de que coproduções gestuais nos erros de fala produzidos por essa população parecem ser um mecanismo muito comum, mesmo que os erros tenham sido percebidos como sendo uma substituição categórica.
Frente ao exposto, à luz da FonGest, chegamos a diferentes hipóteses para explicar a ocorrência dos erros de produção de fala, sobretudo no tocante aos erros produzidos por falantes adultos típicos e com alterações de fala. Acreditamos que a abordagem gestual possa ser estendida para explicar os erros de fala produzidos por crianças em processo de aquisição típico da linguagem.
Retomando o conjunto de resultados obtidos na análise conduzida por BERTI (2009), as produções das crianças podem ser divididas em produções típicas, produções gradientes (marcadas, acusticamente, como contrastes encobertos pelo uso de pelo menos um parâmetro acústico) e substituições categóricas.
Especificamente, na análise perceptivo-auditiva, o processo de posteriorização prevalece nas crianças C1 e C2, enquanto, na criança C3, prevalece o processo de anteriorização. O resultado é aparentemente inesperado se for considerada a recorrência com que o processo de anteriorização é atestado no percurso de aquisição de diferentes línguas – apenas em relação ao português brasileiro, é possível referir as pesquisas de LAMPRECHT (1990), AZEVEDO (1994), RANGEL (1998) e LAMPREHCT
Com base na análise acústica, é possível considerar que o contexto vocálico possa ter exercido influência nas produções das crianças, pois o contexto da vogal /u/, por exemplo, favoreceu a presença maciça de contrastes encobertos nas produções das três crianças (no contexto de /a/, a criança C2 apresentou uma substituição categórica entre as duas oclusivas).
Essa, por sua vez, evidenciou também – por um lado – a presença de estouros duplos e – por outro lado – a presença de contrastes encobertos pelo uso preferencial dos seguintes parâmetros acústicos: pico espectral e
Mas, o que o conjunto dos dados pode sugerir sobre a coordenação de gestos articulatórios?
Em termos gestuais, podemos levantar três possíveis explicações para esses erros, a saber: a coordenação intergestual, desafio de novas rotinas articulatórias e presença de gestos intrusivos. As três hipóteses serão detalhadas nessa ordem abaixo.
Em termos de coordenação intergestual, temos que a coordenação entre os gestos consonantais de ponta da língua (na produção de /t/) e de dorso da língua (na produção de /k/) envolve um acoplamento sincrônico (ou seja, em fase) com os gestos vocálicos, tanto de /a/ quanto de /u/.
No entanto, no contexto de /a/, o acoplamento entre os gestos modelos de ponta da língua (para a produção do /t/) e de corpo da língua (para a produção de /a/) parece não ter sido favorecido para as crianças C1 e C2, na medida em que nenhuma apresentou produção típica de /t/ nesse contexto vocálico. Possivelmente, o oscilador relativo à consoante tenha entrado numa frequência de vibração (
Destacamos, ainda, como hipótese explicativa, que esse
A segunda explicação para os resultados apresentados envolve a provável dificuldade na execução de novas rotinas que incluem sequências distintas de configurações gestuais, como na palavra
O desafio de novas rotinas articulatórias é corroborado pela variabilidade intrassujeito encontrada nas produções de C1 e C2 para o alvo /t/, que emerge como [t] para [‘tuba] e como [k] para [‘taku]. SOSA & STOEL-GAMMON (2006) chamam a atenção para diferentes fatores que podem influenciar a produção de formas variáveis pelas crianças, dentre elas, a complexidade dos traços fonéticos contidos na estrutura – considerados de forma isolada e em sequências dentro da palavra – e o desenvolvimento do sistema do controle motor da fala.
Outro fator apontado pelas autoras é a própria configuração da representação fonológica, que, aos poucos, emerge por meio de unidades representacionais menores do que a palavra (VIHMAN, 1996). Em um primeiro momento, ocorreria um decréscimo na produção das formas variáveis, revelando a presença de uma representação fonológica mais voltada para o segmento e, em um segundo momento, a variabilidade aumentaria, expressando as tentativas de reorganização do sistema. A variabilidade constatada nos dados de C1 e C2 pode expressar, exatamente, essa reorganização. Tal explicação está, inclusive, em assonância com a recorrência atípica, constatada nos dados analisados, do processo de posteriorização, e com a presença do processo de anteriorização de oclusivas, nesse caso, atípico, considerando-se a média de idade de 35,33 (meses) dos sujeitos da pesquisa.
Importante salientar também que todas as crianças apresentaram contrastes encobertos, marcados por pelo menos um parâmetro acústico. A única exceção refere-se às produções de C2 no contexto da vogal /a/. A presença dessas distinções fônicas entre /t/ e /k/ sugere que as crianças estejam utilizando tanto o gesto de ponta de língua para a produção de /t/ quanto o gesto de corpo da língua para a produção de /k/, ainda que esse uso não seja otimizado, o que também pode acenar para o desafio de novas rotinas articulatórias.
Há, no entanto, uma terceira possibilidade explicativa para os resultados apresentados, ou seja, considerar a presença de um gesto intrusivo. Tal possibilidade pode ser hipotetizada pela detecção de estouros duplos em algumas produções.
O leitor pode estar se perguntando, nesse momento, como estouros duplos com características espectrais semelhantes, sugestivas do uso de um único articulador, podem constituir-se em gestos intrusivos?
Para responder favoravelmente à questão posta acima, utilizaremos dois argumentos de natureza acústica.
O primeiro diz respeito à própria análise acústica das produções das crianças, revelando a presença dos contrastes encobertos; o segundo refere-se à possibilidade de caracterização acústica de erros gradientes resultantes de movimentos articulatórios incompletos e/ou parciais. Conforme descrevem GOLDSTEIN, POUPLIER, CHEN, SALTZMAN & BYRD (2007), erros dessa natureza podem ter muito pouco efeito no sinal acústico.
MARIN
Ainda em relação à presença de estouros duplos, como os encontrados nos dados dos três sujeitos de BERTI (2009), seria possível reportar a pesquisa de GIBBON (1999), voltada para dados de sujeitos com queixas fonoaudiológicas que revelam uma dependência entre os articuladores de ponta e corpo de língua.
A autora também detectou diferenças significativas entre os resultados apontados por análises de oitiva e os resultados apontados por eletropalatografias nas produções das plosivas [d] e [g]. Enquanto que análises de oitiva apontaram para a realização de [g], para um alvo /d/, os dados da eletropalatografia evidenciaram o contato inicial da língua com a região posterior do palato e, na sequência, o avanço para a região anterior, como podemos visualizar na Figura 7.
Conceder aos dados de BERTI (2009) a mesma interpretação, ou seja, a existência de uma dependência entre os articuladores não procede por duas razões: (i) a idade mais avançada dos sujeitos da pesquisa; (ii) o papel relevante do desafio de novas rotinas articulatórias já referido
Se os sujeitos selecionados tivessem idades menores, a hipótese poderia ser considerada pelo fato de a literatura da área (LAMPRECHT, 1986; MOTA, 2001; LAMPRECHT
Segundo GOLDSTEIN (2003), diferentes órgãos da fala podem não ser diferenciados pela criança, por exemplo, a ponta da língua
Retomando a explicação dada por GOLDSTEIN (2003) sobre o desenvolvimento de gestos articulatórios, as crianças aprendem, num período inicial do controle motor da fala, a diferenciar os articuladores (nos termos do autor “
Em um segundo momento, há um refinamento do controle neuromotor e, assim, as crianças aprendem a diferenciação intra- articuladores (nos termos desse autor “
Portanto, à luz da FonGest, embora o estabelecimento do contraste entre /t/ e /k/ envolva uma questão de coordenação entre gestos de articuladores potencialmente independentes, as crianças em processo de aquisição parecem dominar gradualmente os gestos envolvendo articuladores independentes (ponta e dorso da língua), tal como exigido no estabelecimento do contraste entre /t/ e /k/.
Os dados analisados no presente estudo, no entanto, foram produzidos por sujeitos com idade média que se aproxima dos 3 anos, o que parece indicar que uma possível dependência entre os articuladores presente no início do desenvolvimento motor da fala já tenha sido superada.
Para elucidar as três possibilidades explicativas aqui apenas sinalizadas, sugerimos que estudos articulatórios da produção de fala em crianças sejam explorados e somados a outros recursos metodológicos, como a análise acústica da fala.
Ao tecer nossas considerações finais, retomamos o mote apresentado na introdução do capítulo: a cena, já presenciada por muitos, de a criança repetir inconformada: -"Eu não disse x, eu disse x" – na verdade, para a criança, y – remete-nos à seguinte questão: seria a ilusão da distinção fônica ou da falta dela da criança ou dos ouvintes?
Considerar a intuição da criança sobre a linguagem, pelo resgate dos duplos estouros e contrastes encobertos a partir de uma análise detalhada, parece-nos essencial para responder a questão posta acima.
Pois, na interpretação do fato crítico – anteriorização de /k/ –, tentamos sustentar que o processo de aquisição fônica não é uma questão de tudo ou nada. Ao contrário, à luz da perspectiva dinâmica, entender os erros na produção de fala das crianças em termos de uma execução e regulação temporal imprecisas dos gestos que formam a palavra-alvo (STUDDERT-KENNEDY & GOODELL’S 1995,
Finalmente, à luz da FonGest, adquirir uma língua implica não somente o aprendizado dos componentes gestuais relevantes, ou seja, as variáveis de trato relevantes e as especificações dinâmicas dos gestos, mas também o refinamento ou aprimoramento de todo esse sistema dinâmico para coordenar esses gestos individuais em uma estrutura molecular maior, tal como a sílaba (GOLDSTEIN, BYRD & SALTZMAN, 2006: 226).
Na Geometria de Traços, o segmento é representado por uma estrutura arbórea constituída por
Ident: os segmentos e traços do
Referem-se a uma métrica quantitativa baseada na análise do espectro como se fosse uma distribuição estatística (FORREST
FFT (transformada rápida de Fourier): refere-se a uma versão simplificada da transformada discreta de Fourier, ou seja, um algoritmo que permite ao computador realizar o equivalente a uma análise de Fourier, decompondo os sons complexos em um conjunto de senóides de diferentes amplitudes e frequências.
A expressão “contraste fônico encoberto” (
Para uma abordagem gestual da Teoria da Otimidade, ver GAFOS (2002), DAVIDSON (2006) e BORROFF (2007), dentre outros.
A força de acoplamento entre os gestos varia em função da complexidade do acoplamento e da velocidade em que o acoplamento precisa ser mantido (GOLDSTEIN & FOWLER, 2003; SALTZMAN, NAM, GOLDSTEIN & BYRD, 2006).