Abstract

Ensaio teórico

A AQUISIÇÃO DO CONTRASTE ENTRE /t/ E /k/ SOB A ÓTICA DINÂMICA

BERTI

Larissa Cristina

arthur@ufpr.br FERREIRA-GONÇALVES

Giovana

arthur@ufpr.br

Universidade Estadual Paulista “Júlio de Mesquita Filho”/Marília Universidade Federal de Pelotas

11 1

A AQUISIÇÃO DO CONTRASTE ENTRE /t/ E /k/ SOB A ÓTICA DINÂMICA

139 196

139-196

http://creativecommons.org/licenses/by/4.0/

Neste trabalho, apresentamos interpretações para o fenômeno de anteriorização de velares na fala de crianças, a partir de modelos teóricos baseados nos seguintes paradigmas: cognitivo simbólico – o qual tem considerado a existência do segmento enquanto representação categórica –; e dinâmico – o qual não só têm considerado diferentes unidades representacionais, como também apresenta outra concepção para o que se entende por representação. A análise focaliza dados acústicos produzidos por crianças de cerca de três anos de idade sob condições controladas num contexto lúdico. Os resultados indicam que todos os sujeitos possuem um contraste encoberto entre as velares e alveolares que pode ser interpretado à luz de pelo menos três hipóteses dinâmicas.

Abstract

In this article, we present different interpretations to the phenomenon of velar fronting, found in the speech of children. This phenomenon is discussed under both of the following paradigms: the symbolic one – which considers the existence of segments as sources of categorical representations – and the dynamic one, which not only considers different representational units, but also provides an alternative conception of what may be taken as a representation. The analysis focuses on acoustic data produced by children of about three years of age under controlled conditions in a ludic context. The results indicate that the subjects have a covert contrast between alveolars and velars that may be interpreted in light of at least three dynamic hypotheses.

Anteriorização Aquisição da linguagem Fonologia Gestual Posteriorização

Introdução Um intrigante fato da linguagem infantil

A cena, já presenciada por muitos, de a criança repetir inconformada: -"Eu não disse x, eu disse x" – na verdade, para a criança, y – remete-nos à seguinte questão: a ilusão da distinção fônica (ou da falta dela) deve ser atribuída à criança ou aos ouvintes?

Para tentar responder a esta questão, debrucemo-nos sobre a produção de fala de uma criança que, durante o chamado processo típico de aquisição da linguagem, apresenta uma tendência à anteriorização dos sons da fala. Ressalta-se que esta tendência, além de ser muito frequente na fala das crianças, pode, também, ser considerada típica até certo momento da aquisição da linguagem.

Para ilustrarmos esse processo de anteriorização, tomemos como exemplo as chamadas substituições entre as oclusivas surdas velares e as oclusivas surdas alveolares, presentes, por exemplo, na produção de [t]avalo para [k]avalo.

Neste caso, podemos ilustrar a seguinte situação:

Uma criança, aos 2 anos e 10 meses de idade, brinca tranquilamente com uma miniatura de um cavalo, quando é interrompida por um adulto que lhe questiona:

(Adulto) – “O que você está fazendo?”

(Criança) – “Tô bintanto com o tavalo”.

(Adulto) – “Ah, com o tavalo?”.

(Criança) – “Não! Com o tavalo. Esse ati ó (criança mostra ao adulto a miniatura do cavalo), o meu tavalo”.

Uma possível interpretação para esta situação seria assumir que, embora a criança possa perceber a distinção entre as oclusivas na fala do adulto – marcada pela sua indignação frente à imitação errada –, não perceberia a distinção entre as oclusivas surdas velar e alveolar em sua própria fala. Desse modo, a não percepção em sua própria fala – marcada pela repetição de sua produção não típica – poderia indiciar que a criança não apresenta a aquisição efetiva desse contraste fônico.

De outra perspectiva, poderíamos entender que a criança além de perceber a distinção entre as oclusivas na fala do adulto, também poderia estar apresentando uma distinção entre esses sons em sua própria fala – marcada na produção do som em sua repetição, juntamente com a demonstração da miniatura frente à não compreensão do adulto –, mas esta distinção não seria efetiva o suficiente para que o adulto pudesse resgatá-la auditivamente.

A múltipla explicação para a ocorrência desse fenômeno na aquisição da linguagem nos remete ao modelo teórico adotado na interpretação e, consequentemente, à concepção de representação fonológica.

A seguir, apresentaremos, primeiramente, as diversas interpretações para essa tendência à anteriorização, a partir de modelos teóricos clássicos baseados no paradigma cognitivo simbólico, os quais têm considerado a existência do segmento enquanto representação categórica e a decorrente atribuição de processos – formalizados pela atuação de regras e/ou restrições – na interpretação das produções de fala das crianças.

Adiante, descreveremos outras interpretações para este mesmo fenômeno a partir de modelos teóricos baseados no paradigma cognitivo dinâmico, os quais não somente têm considerado diferentes unidades representacionais, como também apresentam outra concepção para o que se entende por representação.

1. Representação fonológica categórica

Nos modelos teóricos clássicos baseados no paradigma cognitivo simbólico, responsáveis por grande parte dos estudos que se ocupam da aquisição típica e/ou desviante da linguagem, a representação fonológica é vista de forma categórica, ainda que sua aquisição possa ser compreendida como um processo gradual, na medida em que a criança pode oscilar entre percentuais altos e baixos de produção correta – padrão referido como curva em U e reportado de forma recorrente nos estudos em aquisição fonológica do português (LAMPRECHT et al, 2004).

Um exemplo de modelo teórico no interior do paradigma simbólico é a Fonologia Natural, proposta por STAMPE (1973). Neste modelo, a criança apresenta uma tendência à simplificação, via aplicação de processos fonológicos, que é inerente à sua fala. Essa tendência à simplificação é motivada por limitações físicas, na medida em que visa a diminuir as dificuldades articulatórias das crianças. Os processos fonológicos são, então, formalizados pela aplicação de regras.

Em nosso exemplo, a tendência à anteriorização da obstruinte velar surda é explicada pelo processo fonológico de anteriorização, isto é, um processo fonológico de substituição, em que a oclusiva velar é produzida, geralmente, como alveolar.

A formalização deste processo fonológico pode ser assim representada: /k/ à [t].

Outro modelo teórico que podemos mencionar, com base no paradigma cognitivo simbólico, é a Fonologia Gerativa, proposta por CHOMSKY & HALLE (1968).

Neste modelo teórico, a aquisição fonológica se dá pelo desenvolvimento gradual das regras que atuam em cada sistema linguístico, a partir de operações mentais que utilizam traços distintivos. Todo falante possui, pois, uma representação fonológica e uma representação fonética. A primeira aproxima- se da representação mental que os falantes têm dos itens lexicais, constituindo o que CHOMSKY (1968) denominou de estrutura subjacente; enquanto a segunda aproxima-se da chamada representação de superfície, isto é, da forma fonética efetivamente realizada.

Sendo a Fonologia Gerativa Clássica um modelo teórico derivacional, a relação entre os dois tipos de representação (fonológica e fonética) é estabelecida por meio da aplicação de regras.

Com efeito, as crianças em processo de aquisição fonológica aprendem regras para combinar traços e classes de traços para formar novos fonemas (CROCKER, 1969). Adicionalmente, a ocorrência dos “erros” de produção de fala é determinada por padrões ou regras de combinação envolvendo os traços distintivos.

Assim sendo, em nosso exemplo, a tendência à anteriorização da obstruinte velar poderia ser explicada devido a duas possibilidades:

(i) Substituição de traços distintivos Ex: [ka’valu] – [ta’valu]

Substituição dos traços distintivos [-anterior], [-coronal] para [+anterior], [+coronal];

(ii) Assimilação de traços distintivos Ex: [pe’tεkɐ] – [pe’tεtɐ].

Neste exemplo, entende-se que /k/ copia os traços de /t/ ([+anterior], [+coronal]), tornando-se igual a ele.

Outro modelo teórico, também de base gerativista, muito aplicado à análise dos dados em aquisição da fonologia, é a Geometria de Traços de CLEMENTS & HUME (1995).

Com base nesta teoria, a aquisição é vista como uma associação de traços ainda não ligados à estrutura do segmento: a criança vai formando o segmento aos poucos, por meio da associação de novos traços, seguindo a direção do não marcado para o marcado. A proposta tenta explicar a realização de formas variáveis – por exemplo, [ka’valo] ~ [ta’valo] – pela possibilidade de se considerar a associação de dois valores de traços a um determinado nó1 em um momento da aquisição.

Nesta perspectiva, a tendência à anteriorização das obstruintes velares pode ser explicada devido a três possibilidades:

(i) Substituição de traços distintivos. Ex: [ka’valu] – [ta’valu]

Substituição do traço distintivo, pelo desligamento do traço [dorsal] e a inserção do traço default [coronal]

(ii) Assimilação de traços distintivos (cópia de traços de um segmento para outro)

Ex: [pe’tεkɐ] – [pe’tεtɐ].

Cópia de traços de /t/ para /k/, com o desligamento de [dorsal] e o espraiamento de [coronal].

(iii) Construção gradual do segmento Ex: [ka’valu] – [ta’valu]

Inserção do traço default [coronal]

Sem apresentar um viés teórico estritamente gerativista, mas ainda considerando alguns de seus pressupostos, como a representação subjacente e a Gramática Universal, a Teoria da Otimidade (PRINCE & SMOLENSKY, 1993) – com base em princípios gerativistas e conexionistas – entende que o processo de aquisição fonológica ocorre pelo reordenamento de restrições que constituem a hierarquia do aprendiz, de forma a suprimir as deficiências perceptuais e articulatórias que ainda não permitem que a criança tenha uma forma ideal de output.

A aquisição fonológica se dá pela construção gradual da hierarquia de restrições alvo a ser atingida, por sucessivos movimentos de promoção e demoção de restrições, desencadeados pela aplicação de algoritmos de aprendizagem (TESAR & SMOLENSKY, 2000; BOERSMA & HAYES, 2001). É, justamente, por meio da aplicação dos algoritmos, que a Teoria da Otimidade, ao contrário dos modelos teóricos formais que a precederam, possibilita a formalização da variabilidade de produção encontrada no percurso de aquisição da fonologia, tanto no que se refere à variação intrassujeito quanto à variação intersujeitos.

Nesse sentido, a teoria tem sido aplicada, de maneira profícua, não apenas para o processo de construção gradual do sistema fonológico pelo aprendiz, mas também para explicitar a coexistência de formas variáveis que ocorrem na língua do adulto, o que está diretamente ligado a questões relativas à mudança linguística. É importante salientar que a teoria explica, com o mesmo aparato teórico, a variação encontrada nos dados de aquisição e na fala do adulto, ou seja, por meio de valores instáveis de determinadas restrições que constituem as hierarquias, podendo originar ordenamentos diferenciados em momentos distintos de processamento (BONILHA, 2004).

Seguindo, no entanto, outros modelos teóricos, a Teoria da Otimidade continua a explicar a tendência à anteriorização das obstruintes velares pelas crianças como um processo fonológico. A diferença, no entanto, é que a formalização é explicitada não mais pela aplicação de regras – tendo em vista que a OT pressupõe o processamento em paralelo –, mas pela atuação de um conjunto de restrições hierarquizadas.

Assim, nesta perspectiva, a anteriorização das obstruintes velares pode ser explicada por duas possibilidades:

(i) Substituição de traços distintivos.

Ex: [ka’valu] – [ta’valu]

Substituição do traço distintivo, pela violação das restrições *[coronal] e Ident, dispostas no seguinte ordenamento na hierarquia do aprendiz: *[dorsal] >> Ident >> *[coronal]2.

(ii) Assimilação de traços distintivos (cópia de traços de um segmento para outro)

Ex: [pe’tεkɐ] – [pe’tεtɐ].

/k/ copia os traços de /t/, com a violação das restrições Ident, Agree e *[coronal], dispostas no seguinte ordenamento na hierarquia do aprendiz: *[dorsal] >> Ident >> Agree >> *[coronal].

A ocorrência do processo é explicada basicamente pelo alto ordenamento da restrição de marcação *[dorsal] em relação a restrições de fidelidade e o baixo ordenamento da restrição *[coronal], como podemos constatar em trabalhos como BERNHARDT & STEMBERGER (1998) e BARLOW & GIERUT (1999). No percurso da aquisição, as hierarquias de restrições evidenciadas pelas crianças sofreriam alterações até atingir o ordenamento disposto na gramática do adulto, Max, Ident, Agree >> *[dorsal] >> *[coronal], o qual não permite mais a realização do processo de anteriorização.

Com base, pois, no exame da Fonologia Natural, do modelo de traços de CHOMSKY & HALLE (1968), da Geometria de Traços e da Teoria da Otimidade, podemos identificar claramente que o processo de anteriorização é entendido como a não representação efetiva do segmento a ser produzido, ou seja, neste caso, a oclusiva velar surda /k/.

No entanto, podemos, ainda, levantar algumas questões em relação às múltiplas interpretações dadas ao fenômeno de anteriorização: (i) na medida em que estes modelos baseiam-se primordialmente numa análise de oitiva, haveria uma verdadeira neutralização do contraste fonológico na fala da criança? (ii) em caso de não existir uma verdadeira neutralização do contraste fonológico na fala da criança, será que o detalhe fonético estaria apenas relacionado à representação fonética, não tendo relação com a representação fonológica?

Na tentativa de responder essas questões, apresentaremos algumas interpretações para o mesmo fenômeno a partir de modelos teóricos baseados no paradigma cognitivo dinâmico, os quais não somente têm considerado outra unidade de representação simbólica, como também apresentam outra concepção para o que se entende como representação.

2. Interpretação gestual do fato crítico 2.1. O contraste entre as obstruintes velar e alveolar surdas

Passaremos a apresentar uma interpretação gestual para o exemplo descrito no início deste capítulo, a partir do paradigma cognitivo dinâmico.

Para tanto, utilizaremos como referência a investigação conduzida por BERTI (2009) acerca do processo de estabelecimento do contraste entre /t/ e /k/ no contexto das vogais /a/ e /u/, em três crianças do sexo masculino, com idade média de 35,33 meses (e desvio padrão de 1,88), em processo típico de aquisição da linguagem.

O estímulo utilizado no experimento de produção foi constituído por palavras dissílabas paroxítonas que combinavam as oclusivas /t/ e /k/ com as vogais /a/ e /u/ na posição acentuada (“taco”, “caco”, “tuba” e “cuba”). Foi excluído o contexto da vogal /i/ pelo fato de o /t/ ser produzido como africada diante dessa vogal na região onde foi desenvolvida a pesquisa.

Cada criança foi gravada numa cabine acústica instalada no interior da EMEI com gravador digital Marantz modelo PMD 670 acoplado a um microfone cardióide dinâmico SHURE modelo 8800. Utilizou-se para análise dos dados o software PRAAT 5.0.30 e para análise estatística o software STATISTICA versão 6.0.

Os critérios de inclusão das crianças na amostra foram: a) desenvolvimento típico de linguagem; b) ausência de alterações neurológicas, auditivas e de estruturas orofaciais, e c) presença do processo de anteriorização das obstruintes. Aos responsáveis, foi solicitada a assinatura do termo de consentimento livre e esclarecido.

O procedimento experimental consistiu em solicitar das crianças cinco repetições de cada uma das palavras no interior da seguinte frase veículo: “Fale palavra alvo bem bonito”, por meio de uma atividade lúdica.

Para a investigação do estabelecimento do contraste entre /t/ e /k/, BERTI (2009) realizou tanto uma análise perceptivo- auditiva – 60 ocorrências resultantes das gravações das produções dessas crianças (2 consoantes x 2 vogais x 5 repetições x 3 crianças = 60 produções) –, quanto uma análise acústica das produções julgadas como substituídas e/ou distorcidas.

A análise perceptivo-auditiva foi feita por um foneticista com base nas gravações em áudio das produções das crianças. O foneticista transcreveu as produções como corretas e incorretas, tendo em vista a produção alvo das oclusivas /t/ e/ k/. Adicionalmente, todas as produções transcritas como incorretas foram caracterizadas como erros de omissão, substituição ou distorção das oclusivas. Após um mês da data da transcrição, o mesmo foneticista transcreveu todos os dados novamente. A partir de uma análise de concordância intrassujeito, obteve-se uma porcentagem de concordância de 95% (57/60).

A análise acústica das produções julgadas como substituídas, por sua vez, foi feita com base nos seguintes parâmetros acústicos: (1) inspeção acústica da forma de onda; (2) características espectrais do estouro: pico espectral e momentos espectrais3 – centróide, variância, assimetria e curtose; (3) transição formântica (especificamente, transição de F2); e (4) padrão temporal da closura e do estouro: medidas de duração absoluta e relativa.

A definição dos parâmetros acústicos bem como seu correlato articulatório são sintetizados no Quadro 1:

Figure 1 QUADRO 1 – Síntese dos parâmetros acústicos adotados na análise e seu correlato articulatório

Figure 2

Foi realizada uma análise estatística a partir da ANOVA One-Way para cada uma das crianças, separadamente. Os fatores intrassujeitos foram oclusivas (/t/ e /k/) e as variáveis dependentes foram os oito parâmetros acústicos adotados na análise: pico espectral, centróide, variância, assimetria, curtose, frequência de Locus de F2, medida de duração da closura e medida da duração do estouro. Após a ANOVA One-Way, foi utilizado o Modelo Linear Hierárquico, proposto por RAUDENBUSH et al (2004), para determinar qual ou quais parâmetros acústicos as crianças utilizaram para distinguir as oclusivas /t/ e /k/.

Foram considerados estatisticamente significativos os resultados com valores de p inferiores a 0,05 (p < 0,05) e marginais os resultados com valores de p entre 0,05 e 0,1(0,05 < p < 0,1).

Os resultados da análise perceptivo-auditiva obtidos por BERTI (2009) estão expostos nas Tabelas 1 e 2, conforme o contexto vocálico.

Figure 3 TABELA 1 – Caracterização das produções do G1 (crianças em processo típico de aquisição do contraste entre /t/ e /k/) a partir da análise perceptivo-auditiva no contexto da vogal /a/

Figure 4 TABELA 2 – Caracterização das produções do G1 (crianças em processo típico de aquisição do contraste entre /t/e /k/) a partir da análise perceptivo-auditiva no contexto da vogal /u/

Com base nos resultados dispostos nas tabelas, constata-se uma grande flutuação nas produções das crianças na tentativa de estabelecer o contraste entre /t/ e /k/. Ou seja, observamos, concomitantemente a produções típicas, substituições dos dois segmentos – tanto posteriorização do /t/, quanto anteriorização do /k/ –, bem como distorção de /k/.

São constatados casos de variação intrassujeito, a saber, as produções de C1 e C2 em relação ao alvo /t/, com ocorrências de produções típicas e de substituições, e casos de variação intersujeitos, com a tendência à anteriorização – recorrente processo da aquisição fonológica nas línguas do mundo – constada nos dados de C3, e a tendência à posteriorização, nos dados de C1 e C2.

Quanto ao papel do contexto vocálico, esse parece ser relevante apenas em relação à emergência de /t/, pois C1 e C2 não atingem a forma alvo quando /t/ antecede a vogal /a/, mas apresentam produções variáveis quando o contexto envolve a vogal /u/. Já para /k/, as produções típicas produzidas por C1 e C2 ocorrem nos contextos de /a/ e de /u/ e, para C3, não ocorrem nos dois contextos, o que minimiza o papel do contexto vocálico em relação à oclusiva posterior.

Quanto aos resultados obtidos na análise acústica, BERTI (2009, 2010) detectou, na inspeção acústica da forma de onda, um fenômeno descrito como sendo estouros duplos, isto é, a presença de dois transientes acústicos, geralmente com amplitudes distintas e com durações extremamente reduzidas. Os estouros duplos foram detectados tanto em produções julgadas como típicas quanto em produções julgadas como substituições. As Tabelas 3 e 4 sintetizam esses achados:

Figure 5 TABELA 3 – Caracterização da presença de estouros duplos nas produções do G1 (grupo de crianças em processo típico de aquisição do contraste entre /t/ e /k/) no contexto da vogal /a/

Figure 6 TABELA 4 – Caracterização da presença de estouros duplos nas produções do G1 (grupo de crianças em processo típico de aquisição do contraste entre /t/ e /k/) no contexto da vogal /u/

No contexto da vogal /a/, constatamos estouros duplos em algumas produções apenas da criança C1. Particularmente, identificamos os estouros duplos em 3 ocorrências (60%) de substituições, produção apreendida auditivamente como sendo

/t/→[k], e em uma ocorrência típica de /k/ (20%).

Diferentemente, no contexto da vogal /u/, detectamos a presença de estouros duplos em algumas produções das três crianças. Especificamente, identificamos os estouros duplos em 1 produção julgada como típica de /t/ (20%), em 5 produções julgadas como típicas de /k/ (50%), além das 3 (100%) ocorrências de substituição, produção apreendida auditivamente como sendo /t/→ [k].

As Figuras 1 e 2 ilustram a presença de estouros duplos no contexto da vogal /a/ de C1:

Figure 7 FIGURA 1 – Estouros duplos na produção de C1 da palavra “taco” apreendida auditivamente como sendo uma substituição de /t/ ->[k].

Figure 8 FIGURA 2 – Estouros duplos na produção de um /k/ da palavra “caco”, julgado como típico, pela mesma criança

Uma vez identificada a presença de estouros duplos, BERTI (2009) realizou, ainda, uma análise espectral de cada um dos estouros, objetivando identificar o maior pico de energia dado pelo espectro. A autora descreve que os valores obtidos no pico de cada um dos estouros foram bem semelhantes. O valor do pico espectral do primeiro estouro na produção apreendida como sendo uma substituição de /t/à[k], por exemplo, apontou para características acústicas sugestivas de um /k/ (1613 Hz), assim como o valor do pico do segundo estouro também é sugestivo de características acústicas do mesmo segmento (1583 Hz). As Figuras 3 e 4 ilustram esses achados.

Figure 9 FIGURA 3 – Pico espectral do primeiro estouro (1612,94Hz) relativo à produção julgada como sendo uma substituição de /t/ ->[k] de C1

Figure 10 FIGURA 4 - Pico espectral do segundo estouro (1583,05Hz) relativo à produção julgada como sendo uma substituição de /t/ ->[k] de C1

Nas Figuras 3 e 4, destaca-se que a frequência do gráfico espectral varia de 0 a 11025 Hz. A autora ressalta que essa tendência – características espectrais semelhantes nos estouros duplos – foi observada na análise espectral de todas as ocorrências desse fenômeno, sugerindo o uso de um mesmo articulador.

Os resultados obtidos nos demais parâmetros acústicos considerados nas análises de BERTI (2009) são apresentados detalhadamente nas Tabelas 5 e 6:

Figure 11 TABELA 5 – Valores médios dos parâmetros acústicos referentes às produções das oclusivas /t/ e /k/ no contexto da vogal /a/

***:p<0,001; **:p<0,01; *:p<0,05; _: p marginal: 0,05 < p < 0,1.

Legenda: C = criança; M1 = centróide (Hz); M2 = variância (MHz); M3 = assimetria; M4 = curtose.

Figure 12 TABELA 6 – Valores médios dos parâmetros acústicos referentes às produções das oclusivas /t/ e /k/ no contexto da vogal /u/. Os valores em que p foi significativo estão em negrito

***:p<0,001; **:p<0,01; *:p<0,05; _: p marginal: 0,05 < p < 0,1

Legenda: C= criança; M1= centróide (Hz); M2= variância(MHz); M3 = assimetria; M4 = curtose.

Considerando os resultados expostos na Tabela 5, observa- se, no contexto da vogal /a/, que as crianças C1 e C3 apresentaram uma distinção fônica entre /t/ e /k/ com o uso de pelo menos um parâmetro acústico (assimetria e % de closura, no caso de C1, e pico espectral, no caso de C3). Diferentemente, a criança C2 não apresentou qualquer distinção entre /t/ e /k/, na medida em que nenhum parâmetro acústico apresentou significância estatística apontando para tal distinção fônica.

Por outro lado, conforme os resultados descritos na Tabela 6, nota-se que as três crianças apresentaram uma distinção entre /t/ e /k/ no contexto da vogal /u/, pois, nas produções das três crianças, constatou-se pelo menos um parâmetro acústico – seja ele relacionado às características espectrais, de transição formântica e/ou às características temporais – que conseguiu distinguir as oclusivas surdas alveolar e velar.

O critério geralmente aceito na literatura para considerarmos que um determinado contraste fônico foi efetivamente adquirido pela criança é de 75% de acerto em uma posição particular da sílaba (TEMPLIN, 1957). BERTI (2009) usou esse mesmo critério (75%) em relação aos parâmetros acústicos utilizados para marcar uma distinção fônica. Ou seja, quando a criança utilizava pelo menos 75% dos parâmetros acústicos adotados, considerou que a criança adquiriu efetivamente o contraste fônico entre /t/e /k/. Caso contrário, a produção era classificada da seguinte forma: (a) substituição categórica, quando não havia distinção em nenhum dos parâmetros adotados; (b) contraste encoberto5, quando havia a distinção em apenas alguns parâmetros.

Com efeito, a interpretação dada por BERTI (2009), ao observar os resultados expostos nas Tabelas 5 e 6, é a de que as crianças em processo de aquisição do contraste entre /t /e /k/ apresentaram tanto substituições categóricas quanto contrastes encobertos.

A autora verificou que – no contexto da vogal /a/ – duas das três crianças apresentaram contrastes encobertos, ou seja, utilizaram pelo menos um parâmetro acústico para distinguir as oclusivas /t/ e /k/, embora tais produções tenham sido caracterizadas auditivamente como substituições categóricas. Analogamente, no contexto da vogal /u/, as três crianças apresentaram contrastes encobertos, apesar de 8 substituições terem sido descritas como categóricas auditivamente (3 substituições de /t/à[k] e 5 substituições de /k/à[t]).

Ainda em relação aos parâmetros acústicos adotados, BERTI (2009) apontou para o fato de que as crianças investigadas iniciam, de forma geral, o processo de distinção entre as duas oclusivas a partir das seguintes pistas acústicas, preferencialmente: pico espectral, transição de F2 e % de closura, ou seja, tanto pistas relativas às características espectrais quanto às características temporais.

Em síntese, conforme as considerações feitas pela autora, apesar de todas as substituições entre /t/ e /k/ serem interpretadas como categóricas pela análise perceptivo-auditiva, verifica-se, a partir da análise acústica, que grande parte dessas produções constitui, na verdade, contrastes encobertos, na medida em que as crianças compartilham vários, mas não todos, parâmetros fonético-acústicos relevantes para o estabelecimento do contraste entre as oclusivas velar e alveolar surdas.

O conjunto dos resultados obtidos por BERTI (2009), ao indicar, mais uma vez, a presença de contrastes encobertos nas produções das crianças, conduz, pois, a uma interpretação gestual para explicitar a aquisição da fonologia. Os modelos teóricos referidos anteriormente são capazes, apenas, de formalizar a emergência de contrastes categóricos, mesmo se considerados os enfoques não estritamente gerativos, como a Teoria da Otimidade. Esta apresenta, sem dúvida, dentre os modelos referidos, um maior potencial para a formalização dos contrastes encobertos, mas necessita de substanciais reformulações em relação aos primitivos representacionais e à configuração das restrições que constituem as diferentes hierarquias das línguas6.

Na próxima seção, buscamos, então, explicar os resultados expostos à luz de um modelo dinâmico de produção de fala, tal como a Fonologia Gestual (doravante FonGest).

2.2. Gesto articulatório como unidade de análise do “erro”

A FonGest adota como primitivo de análise o gesto articulatório, definido como uma unidade fonético-fonológica por excelência, ou seja, é uma “oscilação abstrata que especifica constrições no trato vocal e induz os movimentos dos articuladores” (ALBANO, 2001: 52). Desse modo, gestos articulatórios servem, simultaneamente, como unidades de ação (formação de constrição) e de informação (codificando contraste).

Destaca-se, pois, que os gestos articulatórios não correspondem a movimentos individuais dos articuladores, mas sim às ações de constrição de diferentes órgãos do trato vocal designados de variáveis do trato. As variáveis do trato, por sua vez, referem-se a um conjunto de articuladores que formam estruturas coordenativas que irão realizar constrições ao longo do trato vocal (BROWMAN & GOSDSTEIN, 1992; GOLDSTEIN & FOWLER, 2003).

Assume-se, nessa abordagem, que os gestos articulatórios (unidades atômicas) se combinam sistematicamente para formar estruturas maiores, tal como os segmentos e as sílabas (unidades “moleculares”). No entanto, essa combinação gestual se dá de um modo mais elaborado do que simples sequências lineares, permitindo, consequentemente, que haja uma sobreposição entre eles no tempo. As sílabas, então, são consideradas constelações de múltiplos gestos acoplados com determinados graus de coordenação intergestual (GOLDSTEIN & FOWLER, 2003; GOLDSTEIN, BYRD & SALTZMAN, 2006).

A coordenação intergestual das sílabas pode ser obtida especificando a relação de fase (ou timing relativo) entre os gestos envolvidos. A molécula gestual (coordenada temporalmente por gestos individuais), por sua vez, pode ser modelada dinamicamente via relações de acoplamento entre gestos individuais (GOLDSTEIN, BYRD & SALTZMAN, 2006; GOLDSTEIN et al, 2007).

Baseando-se nos princípios do modelo dinâmico de osciladores acoplados, proposto por SALTZMAN & BYRD (2000) e posteriormente estendido por NAM & SALTZMAN (2003), a versão atual do modelo da FonGest preconiza que cada gesto articulatório está associado a um oscilador (não linear) próprio, e a coordenação temporal entre os gestos se dá pelo acoplamento desses osciladores. Há, fundamentalmente, três aspectos do acoplamento de osciladores que parecem ser relevantes para o timing na fala. São eles: o entrainment (isto é, a sincronização rítmica entre os osciladores), os modos de acoplamento estáveis (osciladores em fase e antifase) e a transição de fase.

Esquematicamente, as moléculas gestuais (correspondendo a segmentos ou sílabas) são representadas usando um gráfico de acoplamento em que os pontos representam os gestos articulatórios e as linhas (contínuas e pontilhadas) que ligam esses pontos representam o modo de acoplamento intergestual, conforme a Figura 5.

Figure 13 FIGURA 5 – Gráfico de acoplamento intergestual da palavra “spot” (adaptada de GOLDSTEIN, BYRD & SALTZMAN, 2006: 227)

Na Figura 5, as linhas indicam as relações de acoplamento entre os gestos, sendo que a linha sólida indica acoplamento de gestos em fase (sincrônico) e a linha pontilhada indica acoplamento de gestos em antifase. Como pode ser observado, os gestos de ponta da língua (TT) e de abertura glótica para a produção da fricativa, por exemplo, são acoplados de modo sincrônico (em fase – 0°) com o gesto de corpo da língua (TB) para a produção da vogal, enquanto os gestos de ponta da língua e fechamento labial são acoplados entre si em antifase - 180°.

Destaca-se, ainda, que, embora um conjunto de osciladores não lineares coordenados contenham vários modos estáveis de acoplamento (PIKOVSKY et al, 2003 apud GOLDSTEIN, BYRD & SALTZMAN, 2006), há uma gradação em termos de estabilidade. Ou seja, a coordenação em fase (estendida, por exemplo, para o acoplamento entre os gestos consonantal e vocálico em uma sílaba do tipo CV) é considerada mais estável do que o modo de coordenação em antifase, menos estável (estendido, por exemplo, para o acoplamento entre os gestos vocálico e consonantal em uma sílaba do tipo VC). Isso ocorre pelo fato de a força de acoplamento7 entre os gestos ser maior no acoplamento em fase do que em antifase (GOLDSTEIN & FOWLER, 2003; SALTZMAN, NAM, GOLDSTEIN & BYRD, 2006).

Essa informação acerca dos modos mais estáveis de acoplamento intergestual torna-se importante pelo fato de se hipotetizar que os sistemas fonológicos utilizam, preferencialmente, os modos de acoplamento gestuais mais estáveis e, ainda, que a criança, ao adquirir o sistema fonológico de sua língua, tira partido desses modos mais estáveis para começar a coordenar múltiplas ações na fala (GOLDSTEIN, BYRD & SALTZMAN, 2006).

Na medida em que os gestos articulatórios têm uma estrutura temporal intrínseca e uma magnitude de ativação, há a possibilidade de os gestos se sobreporem ou serem ativados parcialmente durante a produção de fala. A magnitude da sobreposição entre os gestos bem como sua magnitude de ativação, porém, são dependentes de vários fatores, tais como: velocidade de fala (taxa de elocução), estilo (casual x formal) e tipo de órgãos utilizados para realizar a constrição e marcar um contraste linguístico (GOLDSTEIN & FOWLER, 2003).

Alguns estudos, tais como o de BROWMAN & GOLDSTEIN (1990), por exemplo, têm mostrado como a sobreposição gestual na fala casual pode ser usada para explicar eventos como assimilação, apagamento e inserção de segmentos, tradicionalmente explicados pela aplicação de regras fonológicas. Mais recentemente, a abordagem gestual, explorando os diferentes modos pelos quais os gestos se sobrepõem no tempo ou diferentes magnitudes de ativação, tem sido ampliada para analisar e explicar não somente a ocorrência de erros na produção fala de falantes adultos típicos (GOLDSTEIN, POUPLIER, CHEN, SALTZMAN & BYRD, 2007), falantes adultos com alterações de fala (POUPLIER & HARDCASTLE, 2005), crianças com alterações de fala (VAN LIESHOUT & GOLDSTEIN, 2008), como também a consequência perceptual desses erros (POUPLIER & GOLDSTEIN, 2005).

GOLDSTEIN et. al (2007) estudaram, com o uso da articulografia, erros de produção de fala elicitados por repetições de sequências bissilábicas (como, por exemplo,“cop top” e “tip e kip”). A análise das imagens permitiu a seguinte caracterização dos erros, em termos gestuais: a) erros de intrusão gestual (de maior prevalência), b) erros de redução gestual (ou seja, a magnitude do gesto intencionado era reduzida), e c) erros de intrusão gestual concomitante a redução gestual.

Especificamente, os erros de intrusão gestual foram definidos quando o gesto intencionado co-ocorria ou era coproduzido com um gesto da consoante conflitante. Por exemplo, num erro transcrito como sendo uma ocorrência de substituição de /t/ por [k] (“cop cop” ao invés de “cop top”), observou-se a coprodução de um gesto de ponta de língua e um gesto de dorso de língua. Erros intrusivos foram relatados pelos autores desse estudo como sendo os mais frequentes (28,2%). Adicionalmente, os gestos intrusivos variaram o grau de constrição ou sua magnitude de ativação, influenciando o modo pelo qual eles foram percebidos (POUPLIER & GOLDSTEIN, 2005).

Erros de redução gestual, por sua vez, foram definidos quando a magnitude do gesto intencionado era reduzida. Esse tipo de erro apresentou a menor frequência de ocorrência (3,3%). Finalmente, os erros de intrusão gestual concomitante à redução gestual foram também designados como verdadeiras substituições, na medida em que o gesto da consoante alvo se reduz concomitante à intrusão do gesto da consoante conflitante. A frequência desse tipo de errou foi de 4,3% (GOLDSTEIN, POUPLIER, CHEN, SALTZMAN & BYRD, 2007: 394).

Como hipótese explicativa para a ocorrência de erros de gestos intrusivos, os autores propuseram que eles sejam causados pela sincronização rítmica (também chamada de entrainment) de osciladores acoplados, analogamente à sincronização que é observada nos experimentos de coordenação de membros e batidas de dedos (KELSO et al, 1986). Nestes últimos experimentos, sob determinadas circunstâncias (como, por exemplo, o aumento da velocidade), tarefas que envolviam uma complexa coordenação mostraram uma tendência a convergir para uma coordenação em fase (1:1).

Nesse sentido, GOLDSTEIN e colegas (2007) explicam que tanto o gesto de ponta de língua na produção de /t/ em “top”, quanto o gesto de corpo de língua na produção de /k/ em “cop” se acoplam em antifase (2:1) com o gesto labial na produção de /p/, modo de acoplamento menos estável (NAM & SALTZMAN, 2003). A presença do gesto intrusivo corrige esta situação, produzindo um modo mais estável (harmônico) de acoplamento entre os gestos de ponta de língua, dorso e lábios. A Figura 6 ilustra a ocorrência do gesto intrusivo:

Figure 14 FIGURA 6 – Repetição de <italic id="italic-ca6b39ccff25623e3821cb6df07057b2">cop top</italic>, mostrando a transição do modo de acoplamento entre o dorso da língua e o lábio inferior de 2:1 (antifase) para 1:1 (em fase) – adaptada de GOLDSTEIN, POUPLIER, CHEN, SALTZMAN & BYRD (2007, p. 399).

Contudo, os erros de produção de fala podem ser vistos como sendo o resultado de uma inter-relação (tensão) entre contrastes específicos da língua e princípios dinâmicos da coordenação de movimentos em geral (POUPLIER & HARDCASTLE, 2005).

Adicionalmente, os mesmos autores complementam a descrição dos erros numa perspectiva gestual afirmando que

Gradient properties of errors are part of the critical fluctuations that typically accompany spontaneous transitions between different coordination modes. The entrainment view of errors predicts that coproduction and gradient errors will be observed no matter where in the production process errors arise; there is no dichotomy between ‘phonological’, well-formed and ‘phonetic’, ill-formed errors (POUPLIER & HARDCASTLE, 2005: 239).

Estudos mais recentes (VAN LIESHOUT & GOLDSTEIN, 2008) têm explorado uma interpretação dinâmica para os erros produzidos por crianças com alterações de fala.

Destacaremos, particularmente, a interpretação conduzida por VAN LIESHOUT & GOLDSTEIN (2008), pelo fato de esses autores apresentarem estudos envolvendo diferentes questões de coordenação, a saber: a) coordenação entre articuladores individuais (acoplamento intragestual); b) coordenação entre gestos individuais (acoplamento intergestual); e c) intrusão gestual.

Para exemplificar problemas de acoplamento intragestual, VAN LIESHOUT & GOLDSTEIN (2008) baseiam-se nos estudos de WARD (1997) e CHANG et al (2002) (ambos apud VAN LIESHOUT & GOLDSTEIN, 2008). No primeiro estudo, o autor encontrou, nos períodos de fala fluente de pessoas adultas que gaguejam, durante o gesto de fechamento labial, maior variabilidade na fase de acoplamento entre lábios e mandíbula.

No segundo estudo, CHANG et al (2002) usaram medidas de F2 na transição CV como uma forma de mensurar a sobreposição gestual entre C e V. Embora os autores não tenham encontrado diferenças entre crianças gagas e seus respectivos controles, eles encontraram uma tendência para uma menor diferenciação entre consoantes labiais e alveolares na produção das crianças gagas mais novas.

VAN LIESHOUT & GOLDSTEIN (2008) interpretaram essa falta de diferenciação entre labiais e alveolares devido, possivelmente, a um problema de coordenação intragestual. A mandíbula é um articulador que participa da sinergia funcional (ações coordenadas) tanto com os lábios quanto com a língua. Se a coordenação entre lábios e mandíbula for problemática (tal como apontam os resultados de WANG), de tal modo que a tarefa alvo é atingida pela contribuição principal do movimento da mandíbula, então, uma grande diminuição, tanto da abertura labial, quanto da distância entre a ponta de língua e o palato, deverá ocorrer durante a produção das coronais e labiais, respectivamente. A consequência acústica é uma maior similaridade entre coronais e labiais, quando comparada às produções dos sujeitos controles.

Para exemplificar problemas de acoplamento intergestual, VAN LIESHOUT & GOLDSTEIN (2008) baseiam-se nos resultados descritos por TJADEN (2000, apud VAN LIESHOUT & GOLDSTEIN, 2008) em seu estudo de F2 e centróide no espectro do ruído consonantal em sílabas CV em pacientes com doença de Parkinson e seus respectivos controles. Em geral, sujeitos com doença de Parkinson apresentaram maior coarticulação entre a produção de consoantes e vogais. No atual modelo da Fongest, hipotetiza-se que gestos consoanantais e vocálicos sejam acoplados em fase, mas o oscilador de C apresenta uma frequência mais alta que o oscilador de V, coerente com o movimento mais lento e de maior duração na produção da vogal. Como consequência desse acoplamento, os gestos de C e V iniciam-se sincronicamente (ou seja, em fase), mas o gesto de V leva mais tempo para atingir o alvo, o que lhe confere um maior tempo de ativação. O comportamento dos sujeitos com doença de Parkinson (i.e., exibir uma maior coarticulação entre C e V) poderia explicar a preferência pelo modo de coordenação em fase (1:1), em que os períodos dos gestos consonantal e vocálico se sincronizam. Esta sincronia garante um modo de acoplamento ainda mais estável.

Finalmente, para exemplificar erros de intrusão gestual, VAN LIESHOUT & GOLDSTEIN (2008) remetem à revisão realizada por POUPLIER & HARDCASTLE (2005), comparando vários estudos articulatórios em paciente com afasia e apraxia de fala. A conclusão destes últimos autores foi a de que coproduções gestuais nos erros de fala produzidos por essa população parecem ser um mecanismo muito comum, mesmo que os erros tenham sido percebidos como sendo uma substituição categórica.

Frente ao exposto, à luz da FonGest, chegamos a diferentes hipóteses para explicar a ocorrência dos erros de produção de fala, sobretudo no tocante aos erros produzidos por falantes adultos típicos e com alterações de fala. Acreditamos que a abordagem gestual possa ser estendida para explicar os erros de fala produzidos por crianças em processo de aquisição típico da linguagem.

2.3. Acoplamento intergestual e gestos intrusivos nos erros de fala em crianças

Retomando o conjunto de resultados obtidos na análise conduzida por BERTI (2009), as produções das crianças podem ser divididas em produções típicas, produções gradientes (marcadas, acusticamente, como contrastes encobertos pelo uso de pelo menos um parâmetro acústico) e substituições categóricas.

Especificamente, na análise perceptivo-auditiva, o processo de posteriorização prevalece nas crianças C1 e C2, enquanto, na criança C3, prevalece o processo de anteriorização. O resultado é aparentemente inesperado se for considerada a recorrência com que o processo de anteriorização é atestado no percurso de aquisição de diferentes línguas – apenas em relação ao português brasileiro, é possível referir as pesquisas de LAMPRECHT (1990), AZEVEDO (1994), RANGEL (1998) e LAMPREHCT et al (2004), dentre outras. Importante considerar, no entanto, que essa recorrência do processo de anteriorização é atestada em dados relativos a crianças com idades mais precoces, inferiores a 24 meses.

Com base na análise acústica, é possível considerar que o contexto vocálico possa ter exercido influência nas produções das crianças, pois o contexto da vogal /u/, por exemplo, favoreceu a presença maciça de contrastes encobertos nas produções das três crianças (no contexto de /a/, a criança C2 apresentou uma substituição categórica entre as duas oclusivas).

Essa, por sua vez, evidenciou também – por um lado – a presença de estouros duplos e – por outro lado – a presença de contrastes encobertos pelo uso preferencial dos seguintes parâmetros acústicos: pico espectral e onset F2 (parâmetros espectrais), e a duração relativa da closura (parâmetro temporal).

Mas, o que o conjunto dos dados pode sugerir sobre a coordenação de gestos articulatórios?

Em termos gestuais, podemos levantar três possíveis explicações para esses erros, a saber: a coordenação intergestual, desafio de novas rotinas articulatórias e presença de gestos intrusivos. As três hipóteses serão detalhadas nessa ordem abaixo.

Em termos de coordenação intergestual, temos que a coordenação entre os gestos consonantais de ponta da língua (na produção de /t/) e de dorso da língua (na produção de /k/) envolve um acoplamento sincrônico (ou seja, em fase) com os gestos vocálicos, tanto de /a/ quanto de /u/.

No entanto, no contexto de /a/, o acoplamento entre os gestos modelos de ponta da língua (para a produção do /t/) e de corpo da língua (para a produção de /a/) parece não ter sido favorecido para as crianças C1 e C2, na medida em que nenhuma apresentou produção típica de /t/ nesse contexto vocálico. Possivelmente, o oscilador relativo à consoante tenha entrado numa frequência de vibração (entrainment) mais próxima à do oscilador de corpo de língua (i.e., posterior, para a produção do gesto vocálico), resultando no resgate perceptual-auditivo de uma produção similar ao /k/.

Destacamos, ainda, como hipótese explicativa, que esse entrainment entre os osciladores gestuais consonantal e silábico na criança C1 tenha sido parcial, uma vez que a análise acústica das produções dessa criança evidenciou uma distinção entre as oclusivas /t/ e /k/ em dois parâmetros acústicos (assimetria e tempo relativo de closura). Diferentemente, na criança C2, o entrainment entre os osciladores gestuais consonantal e silábico parece ter sido total, uma vez que não houve distinção fônica em nenhum parâmetro considerado, resultando, consequentemente, numa produção muito semelhante à de /k/. Já para a criança C3, que não apresentou, pela análise de oitiva, nenhuma produção típica de /k/ no contexto da vogal /a/, presume-se que o acoplamento entre os osciladores modelos relativos aos gestos consonantal e vocálico também não foi favorecido. No entanto, ao invés de o oscilador do gesto consonantal entrar em sintonia (entrainment) com o do gesto vocálico, parece ter havido uma assintonia, i.e. um distanciamento, entre as suas frequências, propiciando o resgate perceptual-auditivo de uma produção similar ao /t/. Ressalta-se, mais uma vez, que essa assintonia entre os osciladores consonantal e vocálico parece não ser total, para a medida em um único parâmetro acústico (pico espectral) foi sensível para apreender a distinção entre /t/ e /k/.

A segunda explicação para os resultados apresentados envolve a provável dificuldade na execução de novas rotinas que incluem sequências distintas de configurações gestuais, como na palavra taco, envolvendo a realização de um gesto de ponta de língua antecedendo uma sequência de gestos de dorso de língua. Não por acaso, portanto, C1 e C2 apresentam dificuldades na realização de /t/ fundamentalmente no contexto da vogal /a/, com a produção de formas como [‘kaku], originando os processos de assimilação ou de reduplicação na fala da criança, referidos de forma recorrente na literatura. A dificuldade está, pois, na execução de novas sequências articulatórias, como em [‘taku], ferindo templates já estabelecidos, não em uma indiferenciação entre gestos de ponta e de dorso de língua. As produções de [t], de C1 e C2, antecedendo a vogal /u/, e as produções de [k], pelos referidos sujeitos, nos dois contextos vocálicos, acenam, pois, para essa interpretação.

O desafio de novas rotinas articulatórias é corroborado pela variabilidade intrassujeito encontrada nas produções de C1 e C2 para o alvo /t/, que emerge como [t] para [‘tuba] e como [k] para [‘taku]. SOSA & STOEL-GAMMON (2006) chamam a atenção para diferentes fatores que podem influenciar a produção de formas variáveis pelas crianças, dentre elas, a complexidade dos traços fonéticos contidos na estrutura – considerados de forma isolada e em sequências dentro da palavra – e o desenvolvimento do sistema do controle motor da fala.

Outro fator apontado pelas autoras é a própria configuração da representação fonológica, que, aos poucos, emerge por meio de unidades representacionais menores do que a palavra (VIHMAN, 1996). Em um primeiro momento, ocorreria um decréscimo na produção das formas variáveis, revelando a presença de uma representação fonológica mais voltada para o segmento e, em um segundo momento, a variabilidade aumentaria, expressando as tentativas de reorganização do sistema. A variabilidade constatada nos dados de C1 e C2 pode expressar, exatamente, essa reorganização. Tal explicação está, inclusive, em assonância com a recorrência atípica, constatada nos dados analisados, do processo de posteriorização, e com a presença do processo de anteriorização de oclusivas, nesse caso, atípico, considerando-se a média de idade de 35,33 (meses) dos sujeitos da pesquisa.

Importante salientar também que todas as crianças apresentaram contrastes encobertos, marcados por pelo menos um parâmetro acústico. A única exceção refere-se às produções de C2 no contexto da vogal /a/. A presença dessas distinções fônicas entre /t/ e /k/ sugere que as crianças estejam utilizando tanto o gesto de ponta de língua para a produção de /t/ quanto o gesto de corpo da língua para a produção de /k/, ainda que esse uso não seja otimizado, o que também pode acenar para o desafio de novas rotinas articulatórias.

Há, no entanto, uma terceira possibilidade explicativa para os resultados apresentados, ou seja, considerar a presença de um gesto intrusivo. Tal possibilidade pode ser hipotetizada pela detecção de estouros duplos em algumas produções.

O leitor pode estar se perguntando, nesse momento, como estouros duplos com características espectrais semelhantes, sugestivas do uso de um único articulador, podem constituir-se em gestos intrusivos?

Para responder favoravelmente à questão posta acima, utilizaremos dois argumentos de natureza acústica.

O primeiro diz respeito à própria análise acústica das produções das crianças, revelando a presença dos contrastes encobertos; o segundo refere-se à possibilidade de caracterização acústica de erros gradientes resultantes de movimentos articulatórios incompletos e/ou parciais. Conforme descrevem GOLDSTEIN, POUPLIER, CHEN, SALTZMAN & BYRD (2007), erros dessa natureza podem ter muito pouco efeito no sinal acústico.

MARIN et al (2010), por exemplo, ao avaliar as propriedades acústicas de erros articulatórios envolvendo /t/ e /k/ com produções concomitantes de gestos intrusivos, a fim de determinar se esses erros são consistentemente refletidos no sinal acústico, reportaram que as oclusivas são afetadas diferentemente pelos erros de coprodução gestual. Coprodução de gestos de ponta e dorso da língua, durante a produção de um /k/ pretendido, resulta num espectro típico de /k/, enquanto coproduções, durante um /t/ pretendido, resultam num espectro com proeminências tanto em frequências médias (como um /k/), quanto em frequências altas (como um /t/) e, portanto, ambíguo entre /t/ e /k/. Este resultado é explicado pelos autores pelo fato de a constrição com o dorso da língua ter um maior efeito acústico do que a constrição da ponta da língua quando as duas constrições são coproduzidas.

Ainda em relação à presença de estouros duplos, como os encontrados nos dados dos três sujeitos de BERTI (2009), seria possível reportar a pesquisa de GIBBON (1999), voltada para dados de sujeitos com queixas fonoaudiológicas que revelam uma dependência entre os articuladores de ponta e corpo de língua.

A autora também detectou diferenças significativas entre os resultados apontados por análises de oitiva e os resultados apontados por eletropalatografias nas produções das plosivas [d] e [g]. Enquanto que análises de oitiva apontaram para a realização de [g], para um alvo /d/, os dados da eletropalatografia evidenciaram o contato inicial da língua com a região posterior do palato e, na sequência, o avanço para a região anterior, como podemos visualizar na Figura 7.

Figure 15 FIGURA 7 – Resultados da eletropalatografia para um alvo /d/, com a realização de um ponto de articulação velar anormal, com closura posterior e anterior (adaptado de GIBBON, 1999:390)

Conceder aos dados de BERTI (2009) a mesma interpretação, ou seja, a existência de uma dependência entre os articuladores não procede por duas razões: (i) a idade mais avançada dos sujeitos da pesquisa; (ii) o papel relevante do desafio de novas rotinas articulatórias já referido.

Se os sujeitos selecionados tivessem idades menores, a hipótese poderia ser considerada pelo fato de a literatura da área (LAMPRECHT, 1986; MOTA, 2001; LAMPRECHT et. al., 2004) entender que as produções de crianças com desvios fonológicos expressam, na verdade, um atraso em relação a padrões e etapas da aquisição normal. Desta forma, a corroboração de dependência de articuladores nos dados com desvios poderia fazer suspeitar, que o mesmo ocorre com as crianças em aquisição normal. Nesse caso, os resultados encontrados nos sujeitos com queixas fonoaudiológicas de GIBBON (1999) configurariam estágios anteriores pelos quais as crianças com aquisição normal também teriam passado em um determinado momento de seu percurso aquisicional.

Segundo GOLDSTEIN (2003), diferentes órgãos da fala podem não ser diferenciados pela criança, por exemplo, a ponta da língua vs. o corpo da língua. Para o autor, seria difícil avaliar se esses são ou não órgãos distintos em estágios precoces de aquisição, pois mesmo que a criança os reconheça como distintos, pode apresentar dificuldades em mover a ponta da língua independentemente do corpo da língua.

Retomando a explicação dada por GOLDSTEIN (2003) sobre o desenvolvimento de gestos articulatórios, as crianças aprendem, num período inicial do controle motor da fala, a diferenciar os articuladores (nos termos do autor “between-organ contrast”), como, por exemplo: lábios vs. língua.

Em um segundo momento, há um refinamento do controle neuromotor e, assim, as crianças aprendem a diferenciação intra- articuladores (nos termos desse autor “within-organ contrast”), como, por exemplo, ponta da língua vs. corpo da língua. E, posteriormente, na medida em que as crianças vão sendo capazes de diferenciar e movimentar os principais articuladores independentemente, elas, então, passam ao ajuste do grau e do local de constrição desses articuladores. (GOLDSTEIN, 2003: 86). Com bases nessas explicações, supomos que as crianças menores não tenham diferenciado totalmente a ponta da língua do dorso da língua, ou, dito de outro modo, essas crianças parecem estar em processo de distinção e ajuste gestual entre ponta e dorso da língua.

Portanto, à luz da FonGest, embora o estabelecimento do contraste entre /t/ e /k/ envolva uma questão de coordenação entre gestos de articuladores potencialmente independentes, as crianças em processo de aquisição parecem dominar gradualmente os gestos envolvendo articuladores independentes (ponta e dorso da língua), tal como exigido no estabelecimento do contraste entre /t/ e /k/.

Os dados analisados no presente estudo, no entanto, foram produzidos por sujeitos com idade média que se aproxima dos 3 anos, o que parece indicar que uma possível dependência entre os articuladores presente no início do desenvolvimento motor da fala já tenha sido superada.

Para elucidar as três possibilidades explicativas aqui apenas sinalizadas, sugerimos que estudos articulatórios da produção de fala em crianças sejam explorados e somados a outros recursos metodológicos, como a análise acústica da fala.

Considerações finais O fato resgatado: a intuição da criança sobre a linguagem

Ao tecer nossas considerações finais, retomamos o mote apresentado na introdução do capítulo: a cena, já presenciada por muitos, de a criança repetir inconformada: -"Eu não disse x, eu disse x" – na verdade, para a criança, y – remete-nos à seguinte questão: seria a ilusão da distinção fônica ou da falta dela da criança ou dos ouvintes?

Considerar a intuição da criança sobre a linguagem, pelo resgate dos duplos estouros e contrastes encobertos a partir de uma análise detalhada, parece-nos essencial para responder a questão posta acima.

Pois, na interpretação do fato crítico – anteriorização de /k/ –, tentamos sustentar que o processo de aquisição fônica não é uma questão de tudo ou nada. Ao contrário, à luz da perspectiva dinâmica, entender os erros na produção de fala das crianças em termos de uma execução e regulação temporal imprecisas dos gestos que formam a palavra-alvo (STUDDERT-KENNEDY & GOODELL’S 1995, apud HEWLETT & WATERS, 2004: 531), indiciando as tentativas de diferenciação, coordenação e ajustamento gestual por parte das crianças, leva-nos a considerar que tais erros, além de serem constitutivos do processo de aquisição fônica, evidenciam uma etapa intermediária entre a ilusão da distinção fônica e a distinção fônica efetiva.

Finalmente, à luz da FonGest, adquirir uma língua implica não somente o aprendizado dos componentes gestuais relevantes, ou seja, as variáveis de trato relevantes e as especificações dinâmicas dos gestos, mas também o refinamento ou aprimoramento de todo esse sistema dinâmico para coordenar esses gestos individuais em uma estrutura molecular maior, tal como a sílaba (GOLDSTEIN, BYRD & SALTZMAN, 2006: 226).

Na Geometria de Traços, o segmento é representado por uma estrutura arbórea constituída por nós organizados de forma hierárquica. Nós intermediários fazem referência a classes de sons e nós terminais fazem referência aos traços distintivos.

Ident: os segmentos e traços do input devem ter correspondentes idênticos no output; *[dorsal]: proibindo o traço [dorsal]; *[coronal]: proibindo o traço [coronal]; Agree: o traço [coronal] da vogal tônica é idêntico ao da vogal em posição postônica.

Referem-se a uma métrica quantitativa baseada na análise do espectro como se fosse uma distribuição estatística (FORREST et al, 1988). São calculadas a média, a variância, a assimetria e a curtose do espectro. Tais medidas tentam incorporar tanto informações locais do espectro (como, por exemplo, o pico espectral), quanto informações mais globais do espectro (como a forma espectral).

FFT (transformada rápida de Fourier): refere-se a uma versão simplificada da transformada discreta de Fourier, ou seja, um algoritmo que permite ao computador realizar o equivalente a uma análise de Fourier, decompondo os sons complexos em um conjunto de senóides de diferentes amplitudes e frequências.

A expressão “contraste fônico encoberto” (covert contrast) foi primeiramente utilizada por HEWLETT (1988:31) para caracterizar o que é categorizado como contrastes fônicos imperceptíveis auditivamente, mas detectáveis acústica e/ou articulatoriamente.

Para uma abordagem gestual da Teoria da Otimidade, ver GAFOS (2002), DAVIDSON (2006) e BORROFF (2007), dentre outros.

A força de acoplamento entre os gestos varia em função da complexidade do acoplamento e da velocidade em que o acoplamento precisa ser mantido (GOLDSTEIN & FOWLER, 2003; SALTZMAN, NAM, GOLDSTEIN & BYRD, 2006).

Campinas/São Paulo

Mercado de Letras/FAPESP

2001

ALBANO

Eleonora C

O Gesto e suas bordas: esboço de Fonologia Acustico-Articulatória do Português Brasileiro

Porto Alegre

PUCRS

1994

AZEVEDO

Cátia

Aquisição normal e com desvios da fonologia do português: contrastes de sonoridade e de ponto de articulação

1482 1498 v. 42 1999

BARLOW

Jessica

GIERUT

Judith A

Journal of Speech, Language, and Hearing Research Optimality Theory in phonological acquisition

San Diego

Academic Press

1998

BERNHARDT

Barbara

STEMBERGER

Joseph Paul

Handbook of phonological development from the perspective of constraint - Based Nonlinear Phonology

São Paulo School of Advanced Studies in Speech Dynamics

Universidade de São Paulo, Instituto de Matemática

07 Jun 2010

BERTI

Larissa C

http://www.dinafon.iel.unicamp.br/spsassd_files/EscolaSP_Be rti_ final.pdf The establishment of contrast between /t/and /k/ in Brazilian Portuguese children

agosto

Marília

2009

BERTI

Larissa C

Produção e percepção da fala na aquisição incompleta de contrastes fônicos em crianças falantes do português brasileiro. Segundo Relatório Científico referente ao auxílio à pesquisa concedido pela Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP), mediante Programa de Apoio a Jovens Pesquisadores em Centros Emergentes

Disponível em http://roa.rutgers.edu 2001

BOERSMA

Paul

HAYES

Bruce

Rutgers Empirical tests of the gradual learning algorithm

Porto Alegre

PUCRS

2004

BONILHA

Giovana F. G

Aquisição fonológica do português brasileiro: uma abordagem conexionista da Teoria da Otimidade

New York

Stony Brook University

2007

BORROFF

Marianne L

A landmark underspecification account of the patterning of glottal stop

299 320 v. 18 1990

BROWMAN

Catherine

GOLDSTEIN

Louis M

Journal of Phonetics Gestural specification using dynamically defined articulatory structures

155 180 v. 49 1992

BROWMAN

Catherine

GOLDSTEIN

Louis M

Phonetica Articulatory Phonology: an overview

New York

Harper Row

1968

CHOMSKY

Noam

HALLE

Morris

The sound pattern of English

London

Blackwell

1995

CLEMENTES

George

HUME

Elizabeth

GOLDSMITH

John

The Handbook of Phonological Theory The internal organization of speech sounds

203 213 v. 34 1969

CROCKER

John R

Journal of Speech and Hearing Disorders A phonological model of children’s articulation competence

837 5 862 30 2006

DAVIDSON

Lisa

Cognitive Science Phonotactics and articulatory coordination interact in phonology: evidence from nonnative production

269 337 v. 20 2002

GAFOS

Adamantios I

Natural Language and Linguistics Theory A grammar of gestural coordination

382 397 v. 42 1999

GIBBON

Fiona

Journal of Speech, Language, and Hearing Research Undifferentiated lingual gestures in children with articulation/phonological disorders

15th International Congress of Phonetic Sciences

Barcelona, Spain

3 - 9 August 2003

GOLDSTEIN

Louis M

Proceedings Emergence of Discrete Gestures

159 207

Mouton de Gruyter

2003

GOLDSTEIN

Louis M

FOWLER

Carol

SCHILLER

Niels O

MEYER

Antye S

Phonetics and Phonology in Language Comprehension and Production Articulatory Phonology: a phonology for public language use

215 249

Cambridge

Cambridge University Press

2006

GOLDSTEIN

Louis M

BYRD

Dany

SALTZMAN

Elliot

ARBIB

Michael

Action to Language via the Mirror Neuron System The role of vocal tract gestural action units

386 n. 103 412 2007

GOLDSTEIN

Louis M

POUPLIER

Marianne

CHEN

Larissa

SALTZMAN

Elliot

BYRD

Dany

Cognition Dynamic action units slip in speech production errors

523 n. 18 533 2004

HEWLETT

Nigel

WATERS

Daphne

Clinical Linguistics and Phonetics Gradient change in the acquisition of phonology

Paper presented at the 99th meeting of the Acoustical Society of America

Atlanta, GA

1980

KEATING

Patricia

WESTBURY

John

STEVENS

Kenneth A

Mechanisms of stop consonant release for different places of articulation

29 60 14 1986

KELSO

J. A. Scott

SALTZMAN

Elliot

TULLER

Betty

Journal of Phonetics The dynamical theory in speech production: Data and theory

Porto Alegre

PUCRS

1986

LAMPRECHT

Regina R

Os processos nos desvios fonológicos evolutivos

Porto Alegre

PUCRS

1990

LAMPRECHT

Regina R

Perfil da aquisição normal da fonologia do Português. Descrição longitudinal de 12 crianças: 2:9 a 5:5

Porto Alegre

Artmed

2004

LAMPRECHT

Regina R

BONILHA

Giovana F. G

FREITAS

Gabriela C. M

MATZENAUER

Carmen L. B

MEZZOMO

Carolina L

OLIVEIRA

Carolina C

RIBAS

Letícia P

Aquisição fonológica do português: perfil de desenvolvimento e subsídios para a terapia

189 2 211 37 2009

Fangfang

EDWARDS

Jan

BECKMAN

Mary E

Journal of Phonetics Contrast and covert contrast: the phonetic development of voiceless sibilant fricatives in English and Japanese toddlers

445 2 461 127 2010

MARIN

Stepania

POUPLIER

Marianne

HARRINGTON

Jonathan

Journal of the Acoustical Society of America Acoustic consequences of articulatory variability during productions of /t/ and /k/ and its implications for speech error research

Rio de Janeiro

REVINTER

2001

MOTA

Helena B

Terapia Fonoaudiológica para os Desvios Fonológicos

2253 2256

Barcelona

Rundle Mall, Adelaide: Causal Productions

2003

NAM

Hosung

SALTZMAN

Elliot

SOLÉ

Maria J

RECASENS

ROMERO

Proceedings of the XIIth International Congress of Phonetic Sciences A competitive, coupled oscillator of syllable structure

47 75 33 2005

POUPLIER

Marianne

GOLDSTEIN

Louis M

Journal of Phonetics Asymmetries in the perception of speech production errors

227 243 62 2005

POUPLIER

Marianne

HARDCASTLE

William

Phonetica A re-evaluation of the nature of speech errors in normal and disordered speakers

RuCCs Technical report 2

1993

PRINCE

Alan

SMOLENSKY

Paul

Optimality Theory - Constraint Interaction in Generative Grammar

Porto Alegre

PUCRS

1998

RANGEL

Gilsenira de A

Uma análise auto-segmental da fonologia normal: estudo longitudinal de 3 crianças de 1:6 a 3:0

Lincolnwood, IL

Scientific Software International

2004

RAUDENBUSH

Stevens

BRYK

Anthony S

CHEONG

Yuk. F

CONGDON

Richard T

HLM 6: Hierarquical linear and nonlinear modeling

499 526 19 2000

SALTZMAN

Elliot

BYRD

Dany

Human Movement Science Task-dynamics of gestural timing: phase windows and multifrequency rhythms

63 73

New York

Springer

2009

SALTZMAN

Elliot

NAM

Hosung

GOLDSTEIN

Louis. M

BYRD

Dany

FELDMAN

Anatol

Progress in Motor Control: Motor Control and Learning over the Lifespan The distinctions between state, parameter and graph dynamics in sensorimotor control and coordination

31 50 33 2006

SOSA

Ana V

STOEL-GAMMON

Carol J

Journal of Child Language Patterns of intra-word phonological variability during the second year of life

Chicago

University of Chicago

1973

STAMPE

David

A Dissertation on Natural Phonology

Minneapolis

University of Minnesota Press

1957

TEMPLIN

Mildred C

Certain language skills in children

Cambridge, MA

MIT Press

2000

TESAR

Bruce

SMOLENSKY

Paul

Learnability in Optimality Theory

467 479

Malden

Blackwell Publishing

2008

VAN LIESHOUT

Pascal H. H. M

GOLDSTEIN

Louis M

BALL

M. J

PERKINS

M. R

MÜLLER

HOWARD

The handbook of clinical linguistics Articulatory phonology and speech impairment

Cambridge, MA

Blackwell

1996

VIHMAN

Marylin M

Phonological development: the origins of language in the child