Lexical frequency of CCV onset clusters in Brazilian Portuguese: comparing adult speech, child directed speech and child speech in the open corpora FI and FDC

Andressa Toni

Abstract

This paper aims to introduce to the linguistic community a new linguistic resource directed to Language Acquisition studies: the Child Speech Corpus (Corpus FI) and the Child Directed Speech Corpus (Corpus FDC). We built these corpora based on the naturalistic database of Santos (2005) and the computational tools of Benevides e Guide (2016). The corpora consist of a list of frequencies where the researcher can find phonological and morphological information (phonological transcription, stress transcription, syllabic structure, stress category, lexical category, lemma) extracted from the speech productions of 3 children (Corpus FI) and their mothers/caregivers (Corpus FDC). The goal of the paper is i) to describe the methods used in the corpora compilation, providing a basic usage guide; and ii) to show how these data can contribute to the language development research field. For that, we compare the segmental and prosodic frequencies of CCV syllables (Consonant1+Consonant2+Vowel) in adult speech, child directed speech and child speech, establishing how input frequencies influences children’s phonological acquisition path. Results point out to a similarity on CCV’s prosodic and segmental properties between the three corpora. CCV is mostly realized in prosodically salient positions, being usually restricted to the same consonant sequences. Due to CCV’s low frequency of use, low minimal pairs count and phonologically opaque contexts, we claim that input frequency is a factor that contributes to the long path of acquisition of this syllable type, which emerges before 2;0 years old and is acquired only between 5;0-6;0 years old.

Full-text of the article is available for this locale: Português (Brasil).

References

BENEVIDES, A.; GUIDE, B. Corpus ABG (2016). Disponível em https://github.com/SauronGuide/corpusABG (acesso em 1/05/2020).

BONILHA, G. F. G. Aquisição dos ditongos orais decrescentes: uma análise à luz da Teoria da Otimidade. Dissertação (Mestrado em Letras), Faculdade de Letras, UCPel, 2000.

CLEMENTS, G.. The role of features in phonological inventories. In: RAIMY; CAIRNS (orgs.) Contemporary Views on Architecture and Representations in Phonology. Cambridge: MIT Press, 2009, p. 19-68.

CUI, A. The Emergence of Phonological Categories. Tese (Doutorado em Linguística) – Universidade da Pensilvânia, Filadélfia, EUA, 2020.

DRESHER, E. On the Acquisition of Phonological Contrasts. In: van KAMPEN; BAAUW (eds.), Proceedings of GALA 2003, Volume 1 (LOT Occasional Series 3), Utrecht: LOT, 2004, p. 27-46.

ESTIVALET, G. L.; MEUNIER, F. The Brazilian Portuguese Lexicon: An Instrument for Psycholinguistic Research. PLOS ONE, v. 10, n. 12, 2015, p. 1-24. Disponível em: http://www.lexicodoportugues.com/ (acesso em 29/12/2020)

FREITAS, M. J. Aquisição da estrutura silábica no Português Europeu. Tese (Doutorado em Linguística) – Universidade de Lisboa, Lisboa, Portugal. 1997.

GAMALLO, M. G. FreeLing e TreeTagger: um estudo comparativo no âmbito do Português, ProLNat Technical Report, vol. 01, 2013, p. 1-20. Disponível em: http://gramatica.usc.es/~gamallo/artigos-web/PROLNAT_Report_01.pdf.

GOLDSTEIN, L. Emergence of discrete gestures. Proceedings of the 15th International Congress of Phonetic Sciences. Barcelona, Espanha, 3-9 de Agosto 2003. Universidade Autônoma da Barcelona.

LAMPRECHT, R. et al. Aquisição fonológica do Português: perfil de desenvolvimento e subsídios para terapia. Porto Alegre: Artes Médicas, 2004.

LANY J., AND SAFFRAN J.R. Statistical Learning Mechanisms in Infancy. In: RUBENSTEIN J. L. R. and RAKIC P. (ed.) Comprehensive Developmental Neuroscience: Neural Circuit Development and Function in the Brain, volume 3, Amsterdam: Elsevier, 2013, p. 231-248.
LEVELT, C.C.; VIJVER, R., van de. Syllable types in cross-linguistic and developmental grammars. In KAGER, R., PATER, J., ZONNEVELD, W. (Eds.) Constraints in phonological acquisition. Cambridge: Cambridge University Press, 2004. p. 204-218.

MATTOS E SILVA, R. O Português Arcaico - fonologia, morfologia e sintaxe. São Paulo: Contexto, 2006.

NEWPORT, E.; GLEITMAN, H.; GLEITMAN, L. Mother, Id rather do it myself: Some effects and non-effects of maternal speech style. In: SNOW & FERGUSON (eds.), Talking to Children. Cambridge University Press, 1977, p. 109-149.

PESSOA, L. F.; MOURA, M. L. S.. Fala materna dirigida à criança em cenários comunicativos específicos: um estudo longitudinal. Psicologia: Teoria e Pesquisa, Brasília, v. 27, n. 4, p. 439-447, 2011.

PIERREHUMBERT, J. B. Exemplar dynamics: Word frequency, lenition and contrast. In: BYBEE & HOPPER (Eds.), Typological studies in language, John Benjamins Publishing Company, 2001, p. 137-157.

RASO, T., & MELLO, H. (Eds.). (2012). C-oral-Brasil I: corpus de referência do português brasileiro falado informal. Belo Horizonte: Editora UFMG. Disponível em: http://www.c-oral-brasil.org/ (acesso em 29/12/2020)

RIBAS, L. Aquisição do Ataque Complexo. Dissertação (Mestrado em Letras), Porto Alegre: PUCRS, 2002.

RICHARDS, B. J. Child-directed speech and influences on language acquisition: Methodology and interpretation. In: GALLAWAY & RICHARDS (Eds.), Input and interaction in language acquisition. Cambridge University Press, 1994, p. 74–106.

SANTOS, R.S.. Aquisição da estrutura silábica. Letras de Hoje, Porto Alegre, n. 112, 1998, p. 91-98.

___________. A aquisição do ritmo em português brasileiro. Projeto USP, 2005

___________. (2017). A aquisição do padrão acentual e o input. Revista Matraga, v. 24, n. 41, p. 310-340.

SARDINHA, T. B. Linguística de Corpus: Histórico e Problemática. DELTA, v. 16, n. 2, 2000. p. 323-67.

SILVEIRA, K. A. Padrões segmentais, lexicais, silábicos, intra-silábicos e inter-silábicos em crianças falantes de PB. Tese (Doutorado em Letras), Universidade Federal da Bahia, 2006.

TANG, K. A 61 million word corpus of Brazilian Portuguese film subtitles as a resource for linguistic research. UCL Working Papers in Linguistics, n. 24, 2012, p.208–214. Disponível em: http://meshugga.ugent.be/open-lexicons/interfaces/pb-subtitles-unigram/ (acesso em 29/12/2020)

TONI, A. Representação subjacente do ataque ramificado CCV na aquisição fonológica. Dissertação (Mestrado em Letras). Universidade de São Paulo, 2016.

________. Sílabas de ataque ramificado CCV em Português Brasileiro: produtivas ou lexicalizadas?. Quintú Quimün, n. 4, 2020, p. 1-37.

VIGÁRIO, M., S. FROTA, F. MARTINS & M. CRUZ. Frequência na Fonologia do Português: recursos e aplicações. In: COSTA & DUARTe (eds.). Nada na linguagem lhe é estranho. Estudos em homenagem a Isabel Hub Faria. Porto: Edições Afrontamento, 2012, p. 613-631.

YANG, C. The price of linguistic productivity: How children learn to break the rules of language. Cambridge, MA: The MIT Press. 2016. 280p.