Footing e TRP - A arquitetura informal do C-ORAL-Brasil I sob uma ótica socio(inter)acional

Sineide Gonçalves

Resumo

Este artigo contempla o aspecto dinâmico que orienta e organiza as relações interpessoais em eventos microecológicos que Goffman (1979) chamou de footing e considera, também, o momento exato da alternância de turno que linguistas como Sacks, Schegloff e Jefferson (1974; 2003), Marcuschi (2003) e Couper-Kuhlen e Selting (2018) chamam de TRP (Lugar de Relevância para a Transição). O objetivo é verificar em dois arquivos de fala espontânea do C-ORAL-BRASIL I, “bfamcv02” e “bfamcv05”, se o TRP das TCUs (Unidades de Construção de Turno) constituídas nas falas em interação provoca mudanças de footing. Para alcançar este objetivo, elaborou-se uma interface entre a prosódia, Hirst e Di Cristo (1998), Bolinger (1986), Halliday (1967), Robert D. Ladd (2008 [1996]), Gumperz (1988) e Selting, (1995), e as perspectivas teóricas que melhor explicam a estruturação de uma interação falada: a Análise da Conversa, a Linguística Interacional e a Sociolinguística Interacional, Sacks, Schegloff e Jefferson (1974; 2003), Marcuschi (1988; 2003; 2008), Couper-Kuhlen e Selting (2018), Goffman (1972; 1974; 1798; 1981), Gumperz (1982; 1989) e Tannen e Wallat (1987). As análises foram realizadas, portanto, a partir de aspectos sociointeracionais e suprassegmentais e os resultados apontaram que o TRP verificado nas TCUs elaboradas nas duas situações comunicativas escolhidas para este artigo provoca mudanças de footing.

Introdução

Schegloff (1972), Goffman (1974[1]), Gumperz (1989) e Marcuschi (2003[2]) preconizam que uma conversa em interação é uma atividade de fala e se realiza através dos “pares adjacentes”.1 Além disso, eles ainda afirmam que no decorrer de qualquer interação falada os interactantes constantemente alternam turnos e mudam o ritmo de suas conversas. A este aspecto dinâmico que orienta e organiza as relações interpessoais no momento exato das interações face a face Goffman (1979) chama de footing,2 que, dependendo da situação comunicativa, constitui as metamensagens que podem ser acompanhadas de outros recursos como expressão facial, gestos, entonação etc., para indicar implicitamente as instruções de como e em qual momento da conversa ocorre um ponto de conclusão para uma possível alternância de turno. A este ponto de conclusão dá-se o nome de Lugar Relevante para a Transição,3 (doravante TRP) que, de acordo com Sacks, Schegloff e Jefferson (1974; 2003) e Couper-Kuhlen e Selting (2018), é o exato momento da conversa no qual o turno é distribuído e ocorre, geralmente, no final de uma Unidade de Construção de Turno4 (doravante TCU), através de um componente de alocação de turno.

Estudos empíricos sobre footing e TCUs sempre foram preferencialmente realizados a partir de dados audiovisuais, pois, de acordo com Brait (1993[3]), ao se estabelecer uma relação da linguagem com os propósitos comunicativos dos interlocutores de um evento social:

(...) não apenas o que está dito, o que está explícito, mas também as formas dessa maneira de dizer que, juntamente com outros recursos, tais como entoação, gestualidade, expressão facial etc., permitem uma leitura dos pressupostos, dos elementos que mesmo estando implícitos se revelam e mostram a interação como um jogo de subjetividades, um jogo de representações em que o conhecimento se dá através de um processo de negociações, de trocas, de normas partilhadas, de concessões. (BRAIT, 1993, p.194[3]).

Porém, neste artigo serão utilizados arquivos de áudio de fala espontânea gravados em situações comunicativas distintas para reconhecer as mudanças de footing provocadas no TRP das TCUs elaboradas ao longo de duas situações comunicativas escolhidas a partir de marcadores verbais lexicalizados como, por exemplo, ‘quê (what)’ e de parâmetros acústicos de F0 (frequência fundamental) e intensidade, pois, de acordo com Gumperz (1982[4]):

“[…] Prosódia aqui inclui (a) variações de níveis tonais sobre sílabas individuais e suas combinações em contornos, (b) mudanças na sonoridade, (c) ênfase, um traço perceptível geralmente contendo variações na altura, sonoridade e duração, (d) outras variações na duração da vogal, (e) frases incluindo enunciados interrompidos por pausas, acelerações e desacelerações e, sobretudo, (e) na mudança do registro”. (GUMPERZ 1982[4], p. 100, tradução nossa).5

Com os objetivos específicos de identificar, descrever e analisar a alternância contextualmente organizada entre os papéis de falante e ouvinte denominada troca de turno e o objetivo central de verificar se numa troca de turno o TRP das TCUs constituídas ao longo das interações provoca mudanças de footing, selecionei dois arquivos apresentados pelo corpus C-ORAL-BRASIL I6 classificados como textos orais, informais, de tipologia conversacional e caráter familiar/privado. Nestes arquivos mensurei os parâmetros acústicos de F0 e intensidade de algumas TCUs através da ferramenta PRAAT, Boersma e Weenink (1992), para observar como são estabelecidas as relações estruturais e linguísticas na organização da conversa numa alternância de turno (troca de falantes) e a ligação interna das TCUs constitutivas de cada turno. Os arquivos são: “bfamcv02”, um bate-papo que trata de questões relacionadas ao casamento de uma das filhas dos interactantes e o arquivo “bfamcv05”, um texto caracterizado por fala em movimento que mostra uma partida de jogo de várzea, popularmente conhecida como “pelada”.

O C-ORAL-BRASIL I é um banco de dados orais de referência do português brasileiro (doravante PB) composto por registros de fala espontânea com anotações de fronteiras prosódicas em situações comunicativas distintas da diatopia mineira de falantes que residem na cidade de Belo Horizonte. Este banco de dados foi organizado por Raso e Mello (2012[5]) e desenvolvido em 2007-2008 pelo Núcleo de Estudos em Linguagem, Cognição e Cultura (NELC) e pelo Laboratório de Estudos Empíricos e Experimentos de Linguagem (LEEL) da Faculdade de Letras da Universidade Federal de Minas Gerais (UFMG).

Como fundamentação teórica para a realização deste artigo elabora-se uma interface entre a prosódia, aqui representada por Hirst e Di Cristo (1998[6]), Bolinger (1986[7]), Halliday (1967[8]), Robert D. Ladd (1996[9]), Gumperz (1988[4]) e Selting (1995) e as perspectivas teóricas que melhor explicam a estruturação de uma interação falada, a saber: a Análise da Conversa, doravante (AC), aqui representada por Sacks, Schegloff e Jefferson (1974; 2003[10]) e Marcuschi (1988[11]; 2003[2]; 2008[12]), a Linguística Interacional, doravante (LI), representada nesta proposta pelas pesquisas realizadas por Couper-Kuhlen e Selting (2018[13]) e a Sociolinguística Interacional,7 doravante (SI), aqui representada por Goffman (1972; 1974; 1798; 1981[1,14]), Gumperz (1982; 1989[4]) e Tannen e Wallat (1987[15]).

Ao examinar a coparticipação de todos os integrantes das situações comunicativas apresentadas nos dois arquivos do C-ORAL-BRASIL I escolhidos para as análises, procurei observar o comportamento interacional dos interactantes com base nos seguintes aspectos: (i) a realização das alternâncias de turno, (ii) as medidas dos parâmetros acústicos de F0 e intensidade, (iii) as TCUs e o TRP das falas em interação, (iv) os papéis sociais e interacionais realizados pelos participantes dos dois eventos comunicativos.

A relevância deste estudo justifica-se pela possibilidade de se investigar em corpus de textos orais a organização estrutural e discursiva que ocorre nas trocas de turno de eventos comunicativos. O banco de dados utilizado para este estudo nos fornece registros de fala em interação que, segundo Coseriu (1980[16]), sincronicamente seguem estratégias que são ativa ou passivamente negociadas a partir de diferentes níveis de uso da linguagem: nível sintópico (dialeto mineiro), nível sintrático (a conversa das três irmãs e a conversa dos jogadores de futebol) e nível sinfásico (a expressividade das diferentes situações comunicativas apresentadas). Posto isto, podemos vislumbrar pesquisas futuras utilizando o C-ORAL-BRASIL I para discutir a dimensão temporal da fala em interação pensada numa escala de sequencialidade de turnos.

Logo na introdução, salientei a riqueza de discussões que este estudo pode fomentar, em seguida, apresento as abordagens que melhor descrevem a interação falada e logo após descrevo a metodologia para a realização do estudo. Na sequência, faço a análise e a discussão dos dados sob uma ótica socio(inter)acional e prosódica e finalizo com algumas considerações.

1. Interfaces: Análise da Conversa, Linguística Interacional e Sociolinguística Interacional

Introduzida por Schegloff (1972[17]), a AC preocupa-se em estudar o aspecto paradigmático das estruturas linguísticas que podem ser negociadas de acordo com as formas de interação e surge, segundo Marcuschi (2003[2]), como uma tentativa de responder às seguintes questões: Como as pessoas se entendem ao conversar? Como elas reconhecem o diálogo? Como sabem se estão dialogando coordenada e cooperativamente? Como elas utilizam os conhecimentos linguísticos que possuem para entender e interpretar a conversa em interação? Como reagem às ambiguidades surgidas ao longo da conversação? E, principalmente, como alternam contextualmente e organizadamente seus papéis de falante e ouvinte em eventos comunicativos?

Com estudos iniciados nas décadas de 60 e 70, a AC manifesta-se no Brasil sob o título de Análise da Conversação ligada à vertente da Linguística Textual. Porém, recentemente, surge uma vertente sociológica norte-americana, a ACE, que utiliza o termo Análise da Conversa para se referir aos estudos sobre interação falada observando os aspectos sociais e interacionais de indivíduos que participam de eventos comunicativos. Neste artigo, seguirei a vertente de Marcuschi, porém utilizarei o termo Análise da Conversa por entender que o termo “conversa” tem um significado mais homogêneo quando tratamos de interações realizadas face a face entre duas ou mais pessoas.

Marcuschi (2003[2]) ao analisar as características organizacionais da fala em interação assegura que os processos conversacionais que fazem parte das nossas práticas cotidianas seriam “uma interação verbal centrada, que se desenvolve durante o tempo em que dois ou mais interlocutores dirigem sua atenção visual e cognitiva para uma tarefa comum”. Sacks, Schegloff e Jefferson (2003[10]) afirmam que para que ocorra uma conversa é necessário que haja uma dinamicidade enunciativa entre pelo menos dois falantes e que tenha uma sequência de ações coordenadas de alternância de turnos executadas num espaço de tempo adequado ao envolvimento comunicativo. Estes autores pautaram-se nas considerações de Levinson (2007[18]), que entende que os estudos da AC são regidos por princípios analítico- metodológicos. Estes princípios determinam que a conversa não seja pautada em pressupostos teóricos e julgamentos intuitivos, que busque padrões que se repetem em variadas situações comunicativas, que enfatize as inferências realizadas pelos falantes em contextos naturais e que verifique como são geradas as sequências nos atos conversacionais. Partindo dessas premissas, a conversa no contexto deste artigo baseia-se no delineamento feito por Marcuschi (1988[11]):

Como numa conversação várias pessoas agem (ao mesmo tempo ou sequencialmente), trata-se também de uma sequência de ações inter-relacionadas que, de algum modo, devem formar um todo coerente para que sejam compreensíveis. Evidentemente, uma conversação deve preencher uma série de condições cognitivas, contextuais, sociais e linguísticas para que se dê uma interação bem-sucedida.

Para demonstrar que as sequências de ações organizadas de alternância de turnos são fundamentais para a conversa, Sacks, Schegloff e Jefferson (1974) descreveram o sistema de tomada de turnos a partir dois elementos: as Unidades de Construção de Turno - TCU e os Lugares Relevantes para a Transição do Turno – TRP. Sacks, Shegloff e Jefferson, um ano antes da morte de Sacks, publicaram em 1974 o artigo A simplest systematics for the organization of turn-taking for conversation como uma primeira tentativa de definição das TCUs. Este clássico texto da AC apresenta dois importantes componentes e uma Regra Geral: (a) Componente de Construção de Turno, (b) Componente de Alocação de Turnos e (c) Regras que fornecem uma ordem para aplicabilidade das técnicas de alocação de turnos. São elas:

(1) A troca de falante se repete, ou pelo menos ocorre,

(2) Na grande maioria dos casos, fala um de cada vez,

(3) Ocorrências de mais de um falante por vez são comuns, mas breves,

(4) Transições (de um turno para o próximo) sem intervalos e sem sobreposições são comuns.

(5) A ordem dos turnos não é fixa, mas variável,

(6) O tamanho dos turnos não é fixo, mas variável,

(7) A extensão da conversa não é previamente especificada,

(8) O que cada um diz não é previamente especificado,

(9) A distribuição relativa dos turnos não é previamente especificada,

(10) O número de participantes pode variar,

(11) A fala pode ser continua ou descontínua,

(12) Técnicas de alocação de turno são usadas,

(13) Várias unidades de construção de turno são empregadas para a produção da fala que ocupa um turno, por exemplo, os turnos podem ser projetadamente a ‘extensão de uma palavra’ ou podem ter a extensão de uma sentença (cf. § 4.13).

(14) Mecanismos de reparo existem para lidar com erros e violações da tomada de turnos. (SACKS; SCHEGLOFF; JEFFERSON, 2003, p. 18-48[10]).

Nas palavras de Sacks, Schegloff e Jefferson (1974, p. 16),

há vários tipos de unidades com as quais um falante pode começar a construir um turno. Os tipos de unidade para o inglês incluem construções do tipo sentenciais, clausais, sintagmáticas e lexicais. As ocorrências de tipos de unidades assim utilizadas permitem uma projeção do tipo de unidade em andamento, e, grosso modo, o quanto faltará para que uma ocorrência daquele tipo seja completada.

No entanto, a definição de TRP e TCU proposta pelos autores não esclarece quais são os critérios linguísticos envolvidos no funcionamento do sistema de trocas de turnos, ou seja, se os critérios são pautados em níveis sentenciais, clausais, sintagmáticos ou lexicais, e o critério mais mencionado pelos autores é baseado no princípio de projetabilidade.

De acordo com Ribeiro e Garcez (2013, p. 113[19]), a projeção dos participantes de uma interação face-a-face “pode ser mantida através de um trecho de comportamento que pode ser mais longo ou mais curto do que uma simples frase gramatical” e que este traço de comportamento “deve ser considerado um continuum que vai das mais evidentes mudanças de posicionamento às mais sutis alterações de tom que se possa perceber.”. Neste sentido, uma construção sintática frasal, por exemplo, passa a não ser tão importante, ou seja, a relevância do enunciado dependerá, também, do comportamento interacional e de tudo o que está implícito na frase.

Segundo Goffman (1974, p. 496-599[1]), ao conceituar footing, ou seja, o dinamismo dos enquadres, numa construção frasal estão implícitos segmentos prosódicos, não segmentos sintáticos”, ou seja, um enunciado, geralmente, utiliza um segmento prosódico para direcionar a estruturação sintática de sentenças e inclusive servir como guia da interpretação. Pautando-se em outros pesquisadores como Selting (1996; 2000[20]), Ford, Fox e Thompson (1996[21]), Levinson (2007[18]) e Schegloff (2007[22]) observa-se, por conseguinte, que fatores extralinguísticos, não linguísticos, contextuais, situacionais e prosódicos também estão envolvidos nos processos de projeção e finalizações de turno e que a sintaxe isoladamente não consegue esclarecer quais são as estratégias predominantes que ocorrem nas trocas de turno.

Assim como Marcuschi (2003[2]) e Sacks, Schegloff e Jefferson (2003[10]), Elizabeth Couper-Kuhlen e Margaret Selting, em uma série de artigos, concebem a linguagem falada em seu habitat natural, ou seja, na interação social, Selting (2000) e Selting e Couper-Kuhlen (2001; 2001). Inicialmente conhecida como AC, surge, então, a LI, uma teoria que observou que as estruturas linguísticas tinham uma importância primordial para conduzir a fala-em-interação. Representada nesta proposta pelas pesquisas realizadas por Couper-Kuhlen e Selting (2018[13]), a LI se volta para as questões que envolvem diretamente as pistas sintáticas, as pistas prosódicas e a organização de turnos, de reparos e sequências, ou seja, a LI apoiou-se nas pesquisas realizadas pela AC para fazer uma análise linguística de fala-em-interação mais detalhada.

Em síntese, os analistas da conversa estão interessados principalmente em entender como a interação funciona. Já os linguistas interacionais, em consonância, têm um grande interesse na linguagem, porque eles acreditam que ações e sequências são complementadas e tornadas interpretáveis pelo sistemático uso de recursos linguísticos.8

O aspecto paradigmático das estruturas linguísticas é também descrito pela SI a partir de pesquisas realizadas pelos estudiosos da fala em interação. Interessados em estudar a linguagem em contextos sociais específicos alguns pesquisadores como Goffman (1972; 1974; 1798; 1981[1,14]), Gumperz (1982[4]) e Gumperz e Hymes (1972; 1986) enfatizam as características das relações interacionais a partir dos princípios dialógicos de comunicação. Estes princípios, de acordo com estes teóricos, permitem observar a linguagem como um fenômeno microecológico que implica a ideia de sistemas, leis e regras comunicacionais desenvolvidas pelos indivíduos dentro do ambiente interacional. Neste dialogismo, entende-se que a situação comunicativa deve ser engendrada de tal maneira que todos os interactantes consigam entender o que está acontecendo naquele contexto no qual a interação está se desenvolvendo.

De acordo com Marcuschi (2003, p. 16[2]), "para produzir e sustentar uma conversação, duas pessoas devem partilhar um mínimo de conhecimentos comuns. Entre eles estão a aptidão linguística, o envolvimento cultural e o domínio de situações sociais". Assim, toda fala em interação deve sempre estar situada em alguma circunstância comunicativa na qual todos os interactantes alcancem o significado do que foi dito e feito, em outras palavras, todos devem compreender “o que está acontecendo aqui e agora” (RIBEIRO E GARCEZ, 2013, p. 107[19]).

A partir de um estudo voltado para a compreensão do discurso oral e da análise da fala em interação, encontramos o conceito de “enquadre”. Iniciado por Bateson (1972) e desenvolvido por Goffman (1974[1]) no seu extenso estudo intitulado Frame Analysis, o enquadre é um princípio organizacional que orienta os acontecimentos de uma situação comunicativa. Neste estudo, Goffman (2013 [1974], p. 107[14]) afirma que “o enquadre situa a metamensagem contida em todo o enunciado sinalizando o que dizemos ou fazemos ou como interpretamos o que é dito e feito”, e que “em qualquer encontro face a face os participantes estão permanentemente propondo ou mantendo enquadres”. Tannen e Wallat (1987[15]), ao revisar alguns termos análogos a “enquadre” como esquema, protótipo, atividade de fala, módulo, modelo, script, entre outros, utilizados de forma variada na literatura de áreas como Linguística, Inteligência Artificial, Antropologia e Psicologia, sugerem que a definição de todos os termos elencados pode ser concebida através da noção de “estrutura de expectativa”.

Ribeiro e Garcez (2013[19]) propõem, então, a ampliação da definição dada por Tannen e Wallat (1987[15]) sobre “enquadre” e sugerem o estudo desse conceito sob um ponto de vista antropológico/sociológico. Surge, então, duas categorias para definir o termo “enquadre”: enquadres interativos, caracterizados pelos trabalhos do sociólogo Frake (1969[23]), do sociólogo Goffman (1974[1]) e dos pesquisadores da linguística antropológica Gumperz (1982[4]) e Hymes (1974b[24]) que entendem enquadres interativos como uma interpretação feita pelos interactantes de tudo o que ocorre numa interação. A outra categoria é a de esquemas de conhecimento, representada na área de Inteligência Artificial por Minsky (1975[25]) e Schank & Abelson (1977[26]), pelo psicólogo cognitivista Rumelhart (1975[27]) e pelos semanticistas Chafe (1977[28]) e Filmore (1975[29]) que entendem esquemas de conhecimento como expectativas de experiências anteriores que auxiliam na interpretação de um enunciado.

A relação entre enquadres interativos e esquemas de conhecimento será discutida neste artigo para demonstrar que numa troca de turno as mudanças de footing provocadas TRP das TCUs são conduzidas por estruturas de expectativas utilizadas pelos interactantes para reforçar e dar sentido ao que dizem.

Numa interação face a face em um evento social observa-se a existência de uma estrutura de envolvimento entre os participantes fundamentada nas pressuposições e condutas estabelecidas entre os interlocutores ao longo da interação. Esse envolvimento comunicativo pode ser considerado como uma dinamicidade enunciativa que, de acordo (MARCUSCHI, 2003, p. 7[2]), “parte de dados empíricos em situações reais”. Essa dinamicidade enunciativa envolve algumas marcas estruturais que são utilizadas pelos indivíduos para a compreender tudo o que está sendo dito e feito numa situação comunicativa. É exatamente neste contexto que o discurso se realiza.

Para caracterizar a dinamicidade enunciativa realizada pelos participantes de situações comunicativas, Goffman (1981a), a partir dos trabalhos de James (1950[30]) e Schutz (1962[31]), bem como nos trabalhos seminais de alguns filósofos da linguagem como Austin (1963[32]) e Wittgenstein (1922[33]) vai mais além: amplia seus estudos sobre “enquadre” passando à definição de footing como “uma mudança no alinhamento que assumimos para nós mesmos e para os outros presentes, expressa na forma na qual conduzimos a produção ou a recepção e uma elocução”, (GOFFMAN, 1982a, pg. 128). Esta mudança no alinhamento é uma característica inerente à fala que orienta e organiza as relações interpessoais no momento exato da interação.

Para alguns pesquisadores o estudo dos aspectos dinâmicos dos “enquadres” realizado por Goffman (1982a) são conceitos que conseguem definir, de maneira objetiva, a complexidade do comportamento interacional dos participantes de um evento social. Autores como Du Bois (2007[34]), por exemplo, consideram que os falantes interagem com outros falantes e que esses também podem ter seus posicionamentos (posturas). Para Du Bois (2007[34]) a postura de um falante irá alinhar-se ou não à postura do seu interlocutor. Para Du Bois E Kärkkäinen (2012, p. 438[35]) “não há um momento em conversação no qual não seja importante que nos posicionemos frente a outra pessoa”.

Os estudiosos da interação falada, ao dedicarem-se às análises microecológicas, fizeram com que os analistas do discurso concebessem a linguagem enquanto prática social. Além disso, Goffman (1979, p. 1-29), ao direcionar sua grande contribuição teórica ao estudo do footing, salienta que “a mudança de footing está comumente vinculada à linguagem”, ou, seja, o discurso passou a ser entendido como uma construção social e cultural realizada a partir de estratégias discursivas performatizadas pelos participantes de eventos de fala em interação.

2. Prosódia

De acordo com Selting (1995, p. 1),

prosódia é um termo superordenado compreendendo os aspectos suprassegmentais da fala que resultam da interação dos parâmetros acústicos frequência fundamental (F0), intensidade e duração no nível da sílaba ou em domínios mais amplos. Inclui fenômenos auditivos, como entonação, ou seja, a configuração entonacional da fala no decorrer do tempo, volume, extensão, pausa, bem como fenômenos de fala mais complexos, relacionados à velocidade/tempo e ao ritmo.

Alguns autores partiram de uma visão ampla em relação ao conceito de entonação e associaram-na aos traços melódicos representados pela F0 que, coadunados a outros traços suprassegmentais, tais como intensidade e duração, comporiam a prosódia.

Sabe-se que na área da prosódia existe uma discussão em relação à definição do termo entonação: para uns entonação é a variação de pitch, ou seja, variação de tons mais altos ou mais baixos ao longo do enunciado, outros afirmam que a entoação deve ser entendida não só como variações de tons, mas também como atuação de outros parâmetros acústicos tais como a intensidade e a duração. Diante de tais observações, neste artigo optaremos pela proposta de Bolinger (1986[7]), Hirst e Di Cristo (1998[6]), Robert D. Ladd (1996[9]), Gumperz (1988) e Selting (1995) que entendem que a entonação se manifesta a partir de funções entonacionais e defendem que a entonação compreende os aspectos suprassegmentais da fala a partir de correlatos acústicos de Frequência Fundamental (F0), intensidade e duração.

Selting (1996a) mostra ainda como a prosódia pode ajudar na interpretação discursiva ao afirmar que

a sintaxe é usada como um recurso para uma projeção mais abrangente (...) enquanto essa projeção sintática é contextualizada localmente por meio da prosódia. As unidades sintáticas e prosódicas são descritas como esquemas flexíveis que fazem com que os participantes se adaptem às exigências da situação”. (SELTING, 1996a, apud COUPER-KUHLEN; SELTING, 2018[13], p. 47-48, tradução nossa).9

Assim como Gumperz (1988), Hirst e Di Cristo (1998[6]) afirmam que o termo entoação diz respeito a um nível físico e que é representado pela F0 e consideraram ainda que a prosódia, juntamente com as pistas de contextualização, pode sinalizar os nossos propósitos comunicativos ou inferir os propósitos comunicativos de nossos interlocutores. Estes autores, além de considerarem a entonação como parte da prosódia, pautaram-se nas considerações de Gumperz (1982a[4]) e admitiram que as pistas prosódicas dependem do contexto do discurso e da experiência anterior do ouvinte.

Hirst (1988[36]) afirma que a entonação possui características universais porque pode ser percebida nas enunciações de todo falante e possui também características específicas por ser capaz de reconhecer ativa ou passivamente diferentes níveis de uso da linguagem, sejam eles sintópico, sintrático ou sinfásico Coseriu (1980[16]).

Bolinger (1986[7]) assim como Robert D. Ladd (1996[9]), entre outros, destacam o caráter icônico da entonação priorizando a função pragmática (ex. asserção versus pergunta), a função sintática (fraseamento prosódico), a função discursiva (troca de turno, marcadores conversacionais), a função expressiva (atitudes e emoções) e as funções discursivas, voltando a sua atenção para qualquer tipo de gesto ou ato comunicativo que permita um aprofundamento de análises prosódicas.

Segundo Bolinger (1986[7]) a prosódia pode também estabelecer uma interação direta com o nível semântico. Na frase, “very, very tasty”, por exemplo, para enfatizar o sabor a F0 é geralmente reduzida. Ao descrever um tempo muito longo, geralmente ocorre o alongamento da segunda palavra “long da frase “a long, long time. Além disso, segundo Bolinger (1986[7]), os dois casos podem vir acompanhados de uma linguagem corporal como gestos, olhares etc., que reiteram o caráter icônico da entonação. De acordo com o autor, para todas estas situações comunicativas, a partir de três funções fundamentais - formação de acento tonal10, formação de contornos entonacionais e formação de fronteiras prosódicas – pode-se compreender a estrutura de qualquer discurso constituído no decorrer da fala-em-interação.

Em dissertação intitulada As Práticas Discursivas de Marília Gabriela em Entrevistas com Atores Considerados Galãs da Televisão Brasileira pautei-me nos conceitos apresentados por Hirst e Di Cristo (1998[6]), que compreendem a entonação como parte da prosódia e admitem que a entoação é utilizada para sinalizar traços melódicos, considerados pistas prosódicas, utilizadas para sinalizar os nossos propósitos comunicativos ou inferir os propósitos comunicativos de nossos interlocutores e que estes traços podem ser percebidos nas enunciações de todo falante.

Nessa pesquisa analisei os aspectos da construção discursiva e os propósitos comunicativos de Marília Gabriela11 diante de três entrevistados diferentes e mensurei, através do software PRAAT, as variações prosódicas de F0 (frequência fundamental) e duração12 de alguns trechos destas entrevistas enfatizando a alternância dos turnos e as formas de como o discurso se estruturou no decorrer das interações.

Nas três entrevistas observei que houve um aumento de F0 e alguns alongamentos silábicos em vários enunciados. Na entrevista A, por exemplo, ao enunciar “Eu conheço geminia::nas”, Marília Gabriela utilizou um alongamento da vogal tônica a:: que teve uma duração de 0,415s, e uma F0 que chegou a alcançar 199 Hz indicando mudanças de footing a partir das estruturas de expectativas dos esquemas de conhecimento que ela possuía a respeito de Reynaldo Gianecchini. Na entrevista B, no enunciado E quando NÃO::? observei que ocorreu uma elevação de F0 que inicia com 162 Hz e finalizada com 305 Hz. O advérbio de negação “NÃO” mostrou um alongamento silábico que apresentou um valor de 0,445s bem mais longo em relação às outras sílabas produzidas neste enunciado, evidenciando a realização de uma pista de contextualização (inferência) e uma mudança de footing realizada por Marília Gabriela.

Na entrevista C, ao enunciar: “(.h)o que eu tô perguntan::do é”, observei que a F0 inicial do enunciado apresentou-se bastante alta, na faixa de 280 Hz com final de 136 Hz. Notei também um alongamento na palavra “perguntan::do”, de 0,176s em média, bem maior em relação ao alongamento do enunciado anterior – “o que eu tô” – que teve uma duração média de 0,100s e do enunciado posterior - é – que teve uma duração de 0,104s. Estas variações de F0 e duração observadas no enunciado “(.h)o que eu tô perguntan::do é” representaram a mudança de footing feita pela entrevistadora no momento em que ela especificou o que na verdade ela gostaria de saber.

Nesta pesquisa concluí que os elementos prosódicos de F0 e duração observados nos pares adjacentes ocorridos nas três entrevistas podem ser considerados propriedades idiossincráticas que, além de caracterizar o estilo comunicativo da entrevistadora Marília Gabriela, foram utilizadas como estratégias discursivas escolhidas durante a conversação para que se estabelecesse uma correspondência das expectativas dos interlocutores que se preparam para este tipo de encontro social.

Barbosa (2013[37]), em dissertação intitulada Sobreposição de Fala em Diálogos: Um Estudo Fonético-Acústico, pautando-se nos estudos realizados por Schegloff (1998[17]), French e Local (1983[38]), Jefferson (1989[39]) e Wells e Macfarlane (1998[40]) também analisou sintática e semanticamente os correlatos acústicos de duração, F0 e entoação de falas naturais que pudessem encontrar um padrão de pistas acústicas e estratégias discursivas que os falantes utilizam durante uma interação dialógica. Nesta pesquisa, ao realizar uma análise fonético-acústica de um corpus composto por três diálogos de falas gravados de maneira semi-espontâneas com seis sujeitos falantes nativos do PB, Barbosa (2013[37]) observou que uma sobreposição de fala é definida pela fonética, pelo o foco informacional e pela adequação sintática da língua. Barbosa (2013, p. 103[37]) concluiu que

(...) alguns tipos de marcadores de discurso (Mas, então, né) identificam ao interlocutor um momento de LTR juntamente ao aumento da intensidade do parâmetro fonético de Fo e muitas vezes até mesmo do padrão melódico entoado pelo falante, (2) No entanto, não há um padrão que defina o aumento de Fo como um aspecto fonético sistemático para a tomada de turno, visto que houve dados em que isto não aconteceu. Portanto, nos levando a concluir que existe sim uma variação de parâmetros prosódicos durante a sobreposição de fala que impede apontar um único recurso para a solução do conflito nos casos em que há tomada de turno.

É interessante destacar que os resultados das duas dissertações de Mestrado citadas anteriormente concluíram que ocorrem variações de parâmetros prosódicos durante as sobreposições de fala e que recursos discursivos, como pistas de contextualização, footing, esquemas e conhecimento e enquadres interativos, são utilizados para a realização de alternância de turnos.

3. Método

Para este estudo, selecionei dois arquivos13 do C-ORAL-BRASIL I classificados como informais, de tipologia conversacional e caráter familiar/privado. O primeiro arquivo, “bfamcv02”, foi gravado com apenas 1 microfone omnidirecional (capta o som de todas as direções), o segundo arquivo, “bfamcv05”, apresenta o áudio de um evento comunicativo em movimento, gravado com 4 microfones monodirecionais.

A partir da segmentação dos enunciados em grupos prosódicos, o segundo passo foi realizar uma análise acústica através do PRAAT, Boersma e Weenink (1992), para observar e mensurar a média de F0 e a intensidade, utilizando como critério a seleção de uma palavra específica das TCUs que foi projetada potencialmente com acento tonal como mecanismo para a tomada do turno, ou seja, o critério é a oitiva das proeminências prosódicas dentro do enunciado. Saliento que, segundo (SACKS, SCHEGLOFF, JEFFERSON, 2003, p. 15[10]), “várias ‘unidades de construção de turnos’ são empregadas, por exemplo, os turnos podem ser projetadamente a ‘extensão de uma palavra’ ou podem ter a extensão de uma sentença (cf. § 4.13).”. Os aspectos prosódicos foram embasados principalmente nas pesquisas desenvolvidas por Bolinger (1986[7]), Robert D. Ladd (1996[9]) e Gumperz (1988) quando me refiro às funções discursivas e atitudinais da entonação.

Quando foram atendidas todas as condições descritas, associei os princípios sociointeracionais aos aspectos discursivos e atitudinais da entonação para observar a construção enunciativa realizada pelos participantes destas diferentes situações comunicativas, considerando o comportamento dos interactantes a partir dos seguintes aspectos : (i) realização das alternâncias de turno, (ii) as medidas dos parâmetros acústicos de F0 e intensidade, (iii) as TCUs e o TRP das falas em interação, (iv) os papéis sociais e interacionais realizados pelos participantes dos dois eventos comunicativos.

4. As análises

4.1 Arquivo de áudio “bfamcv02” – Formato: rtf – Microfone: omnidirecional não oculto Metadados: C-ORAL-BRASIL I – Duração: 07min51s de uma conversa informal, de caráter familiar/privado.

O arquivo “bfamcv02” é um tipo de evento social de bate-papo informal. Este arquivo apresenta uma comunicação face a face entre três irmãs localizadas na mesma unidade de espaço e tempo com percepção e interação multimodal recíproca direta. São elas: (RUT) Ruth, professora aposentada e residente da cidade de Belo Horizonte/MG, (TER) Terezinha, dona de casa, residente da cidade de Belo Horizonte/MG, (JAE), Jael, professora aposentada e mora também em Belo Horizonte/MG. A conversa foi realizada no dia 03 de julho de 2008, no lanche da tarde, na sala de jantar da casa de uma das participantes, e tratava de questões relacionadas ao casamento da filha de (TER).

O Trecho (1) escolhido para as análises teve início aos 64s e final aos 85s. Este trecho foi transcrito no C-ORAL-BRASIL I em formato Childes-Clan, Macwhinney (2000) e posteriormente implementado para a anotação prosódica, Moneglia e Cresti (1997). Os enunciados foram segmentados em unidades tonais.

Vamos observar neste trecho o comportamento interacional de (RUT), uma das três interactantes.

Trecho (1)

*RUT: [66] se bem que ea tem o Anderson / né //$

*RUT: [67] e a [/2] e o meninim / né //$

*TER: [68] é //$

*RUT: [69] e o xxx //$

*TER: [70] conta ocê / Rute //$

*TER: [71] mas ea tem quarenta-e tantos //$

*TER: [72] sei o tanto não //$

*RUT: [73] <pelo> amor de Deus //$

*TER: [74] <hein> //$

*RUT: [75] nũ me convida pa ser Epa [/1] madrinha não / hein//$

*TER: [76] <não> //$

Na Figura 1 podemos observar que no início do trecho, linhas 66 e 67 as TCUs <se bem que ea tem o Anderson / né //$, a [/2] e o meninim / né //$ > foram construídas a partir de um movimento ascendente na região pré-nuclear do contorno entonacional característico de sentenças declarativas que, de acordo Bolinger (1984[7]), são marcadas por este movimento de F0 e por um movimento entonacional descendente no final da sentença.

Figure 1. FIGURA 1 – Onda sonora e curva de F0 e intensidade das TCUs das linhas 66, 67 do trecho (1) do Arquivo “bfamcv02” do C-ORAL-BRASIL I . Fonte: elaborado pela autora

Pelo espectograma mostrado na Figura 2 pode-se perceber que o momento propício da alternância de turno, ou seja, o TRP, ocorreu na fronteira entre a TCU final de (TER), linha 72, e início da TCU de (RUT), linha 73, ao enunciar <pelo> amor de Deus>.

Figure 2. FIGURA 2 – Onda sonora, espectrograma e curva de F0 e intensidade da TCUs da linha 72, 73 e 74 do Trecho (1) do Arquivo “bfamcv02” do C-ORAL-BRASIL I . Fonte: elaborado pela autora

A Figura 3 mostra que a o enunciado de (RUT) <pelo amor de Deus //$>, linha 73, marca a fronteira prosódica e o TRP. Além disso, pode-se afirmar que a sílaba tônica da palavra <pelo> foi enunciada com maior proeminência, ou seja, houve um aumento de F0 chegando a uma F0 de 379,9 Hz e uma intensidade de 76,24 dB. Já a postônica “lo” da palavra <pelo> teve a vogal final apagada, ou seja, a vogal inicial da palavra ‘amor’ foi transferida para a postônica da palavra anterior. Este fenômeno chama-se sândi vocálico, que, segundo Cagliary (2015, p.2[41]), “consiste em transformação de estruturas silábicas, neste contexto, causadas, em geral, pela queda de vogais ou pela formação de ditongos ou mesmo pela ocorrência peculiar de certos sons”.

Figure 3. FIGURA 3 – Onda sonora, espectograma e curva de F0 e intensidade da TCU da linha 73 do Trecho (1) do Arquivo “bfamcv02” do C-ORAL-BRASIL I . Fonte: elaborado pela autora

Hallyday (1967[8]) chamou de foco informacional14 uma ou mais TCUs que recebem uma maior proeminência15 na palavra, na sílaba ou na sentença podendo trazer uma informação ainda não compartilhada e trazer algo novo ao contexto interacional. Corroborando, Leite (2009, p.36[42]) afirma que “o foco informacional, por sua vez, relaciona-se, da mesma forma, à estrutura e diz respeito à parte da sentença que constitui informação nova, geralmente captada por uma pergunta ou pelo contexto informacional prévios”.

Nas Figuras 4, 5 e 6 o PRAAT mostra que na linha 75 a TCU <nũ me convida pa ser Epa [/1] madrinha não / hein //$> também foi construída a partir de um movimento ascendente na região pré-nuclear do contorno entonacional que caracteriza sentenças declarativas marcadas por movimento entonacional descendente no final da sentença, Bolinger (1984). Este enunciado apresenta um foco informacional que, no caso, seria a recusa de (RUT) em ser madrinha do casamento da filha de (TER) e, para enfatizar a recusa, (RUT) utilizou um contorno entonacional marcado por um movimento de F0 na sílaba tônica da palavra “convida”, imprimindo uma F0 de 323,3 Hz e uma intensidade de 64,78 dB. Observa-se que apenas a F0 da tônica foi superior à da sílaba pretônica ‘con’ que teve uma F0 de 276,9 Hz e uma intensidade menor de 68,33 dB. A postônica atingiu uma F0 de 379,7 Hz e uma intensidade de 59,39 dB.

Figure 4. FIGURA 4 – Onda sonora e curva de F0 e intensidade da sílaba ‘vi’ da palavra ‘convida’ da TCU da linha 75 do Trecho (1) do Arquivo “bfamcv02” do C-ORAL-BRASIL I . Fonte: elaborado pela autora

Figure 5. FIGURA 5 – Onda sonora e curva de F0 e intensidade da pretônica ‘con’ da palavra ‘convida’ da TCU da linha 75 do Trecho (1) do Arquivo “bfamcv02” do C-ORAL-BRASIL I . Fonte: elaborado pela autora

Figure 6. FIGURA 6 – Onda sonora e curva de F0 e intensidade da postônica ‘da’ da palavra ‘convida’ da TCU da linha 75 do Trecho (1) do Arquivo “bfamcv02” do C-ORAL-BRASIL I . Fonte: elaborado pela autora

Considerando o parentesco das interactantes, na TCU produzida por (RUT) na linha 75, <nũ me convida pa ser Epa [/1] madrinha não / hein //$>, percebe-se uma inferência realizada por ela ao se recusar a ser madrinha de casamento da filha de (TER). Essa inferência pode confirmar a relação existente entre os enquadres interativos e esquemas de conhecimento que (RUT) possui a respeito da sua irmã (TER) e a respeito do casamento da sua sobrinha.

A partir do áudio e das análises realizadas no PRAAT, observa-se também que ao enunciar <pelo amor de Deus, nũ me convida pa ser Epa [/1] madrinha não / hein //$>, (RUT) determinou seu posicionamento, sua postura e, ao mesmo tempo, negociou esse alinhamento para esclarecer que não aceitaria um possível convite para ser madrinha de casamento, realizando uma mudança de footing, termo usado por Goffman (1979), para demonstrar como as relações interpessoais são engendradas em eventos de fala-em-interação.

Salientamos que as estruturas inesperadas na melodia dos enunciados de (RUT) são propriedades idiossincráticas que foram por ela utilizadas para reforçar sua recusa em ser madrinha de casamento da filha de (TER). Além disso, o comportamento linguístico de (RUT) pode ser explicado também a partir de uma observação realizada por Hirst e Di Cristo (1998[6]), que admitem que a prosódia possui traços melódicos, considerados pistas acústicas utilizadas para sinalizar os nossos propósitos comunicativos ou inferir os propósitos comunicativos de nossos interlocutores. Além disso, Couper-Kuhlen e Selting (2018, p.36[13]) afirmam que “but even syntax and intonation, or prosody and phonetics more generally, do not suffice to fully capture all the relevant ingredients of a TCU”, ou seja, ações e sequências também são complementadas e tornadas interpretáveis pelo sistemático uso de recursos linguísticos incorporados a uma grande variedade de práticas linguísticas multimodais simultâneas como volume de voz, gestos, olhar, reparo, sequenciação etc. Vale salientar que os recursos visuais estão fora do escopo deste trabalho.

4.2 Arquivo de áudio “bfamcv05” – Formato: rtf – Microfone: quatro microfones de encaixe não ocultos – Metadados: C-ORAL-BRASIL I – Duração: 10min32s de uma conversa informal, de caráter familiar/privado.

São seis os participantes deste evento comunicativo: (CAR) Carlos, professor, da cidade de Inhapim / MG e trabalha como administrador regional de partidos políticos, ele mora em Betim / MG há vinte anos, (CEL) Celsinho, lojista, da cidade de Passatempo / MG, mora em Betim MG há dezessete anos, (JOS), José, piloto e mora em Juiz de Fora / MG, (MAR), Marcelo, oficial do programa “Bolsa Família”, da cidade de Betim / MG, além de dois intervenientes, um desconhecido e (REN) Renata, professora de português e pós-graduanda, que mora na cidade de Betim/MG.

O evento sociocomunicativo que vamos analisar retrata uma partida de futebol.16 As variedades sociolinguísticas podem ser conferidas a partir desses dados sintópico, sintrático, sinfásico, Coseriu (1980[16]) indicados para este tipo de desporto, uma vez que esta modalidade esportiva é realizada há muito tempo nas mais variadas regiões do planeta e pelos mais variados tipos de participantes. Partidas de futebol podem ser consideradas uma atividade sociointeracional que, muitas vezes, utiliza a língua falada para orientar os jogadores, mas que também pode ser exercida por pessoas que possuem deficiência auditiva.

De acordo com Mello (2014, p. 46), “a relação com o contexto situacional é fortemente influenciada pela presença ou ausência de movimento que, por sua vez, condiciona, em grande medida, a estruturação da fala”. Neste sentido, o arquivo “bfamcv05” foi escolhido porque apresenta o áudio de uma situação comunicativa gravada em movimento. Trata-se de uma partida de futebol de várzea formada por quatro jogadores que ocorreu no dia 11 de agosto de 2009. Os times foram formados por 4 jogadores: José (JOS) e Carlos (CAR) X Marcelo (MAR) e Celso (CEL).

Salientamos que o arquivo “bfamcv05” foi gravado com 4 microfones monodirecionais e o software Winpitch, Martin (2005), evidencia os marcadores conversacionais suprassegmentais dos quatro jogadores.

O Trecho (2) que se segue foi escolhido para as análises e tem início aos 152s e final aos 166s. Para este artigo, analisaremos apenas os marcadores utilizados nas falas de (JOS) e (MAR).

Trecho (2)

*MAR: [121] bateu fora / uai //$

*MAR: [122] não //$

*CEL: [123] não //$

*JOS: [124] uai / saiu //$

*MAR: [125] ai bosta //$

*MAR: [126] ocê quebra meu +$

*MAR: [127] <Nossa Senhora / cê quebrou minha> [/1] meu +$

*JOS: [128] <quê> //$

*JOS: [129] <nem encostei> n' ocê / varão //$

*MAR: [130] Nosso Pai //$

*CAR: [131] ô varão / desculpa //$

*MAR: [132] <ai> //$

*JOS: [133] <tá valendo> / sô //$

*MAR: [134] volta //$

As TCUs selecionadas para as análises revelam trocas de turno realizadas através de pares adjacentes que mostram mudanças de footing marcadas por contornos entonacionais ascendentes evidenciados em falas sobrepostas quando um dos jogadores se contunde. Verifica-se que, apesar de várias contusões e interrupções, os jogadores sempre voltam ao mesmo “enquadre” dando continuidade à partida de futebol e marcando, inclusive, vários gols.

O Trecho (2) mostra que ao longo da partida de futebol (MAR) e (CEL) estavam disputando a bola com (JOS) e (CAR). Observa-se que, numa jogada dividida, o jogador (JOS) atingiu acidentalmente o jogador do time adversário (MAR), que expressou uma forte dor ao enunciar nas linhas 125 e 126 <ai bosta //$, ocê quebra meu +$>. Neste cenário pode-se afirmar que foi exatamente esta contusão que determinou a mudança de footing de (MAR), pois, até então, seu posicionamento era de um jogador que estava disputando uma bola dividida. Bolinger (1986[7]) assim como Robert D. Ladd (1996[9]), destacam o caráter icônico da entonação priorizando algumas funções como a função expressiva (atitudes e emoções), entre outras, que pode se manifestar através da expressão facial ou da linguagem corporal. Além disso, Bolinger (1986[7]) ainda afirma que quando uma sílaba, uma palavra ou uma sentença carrega um grau maior de emotividade ocorre um aumento de F0 que geralmente caracteriza palavras ou expressões utilizadas para manifestar fortes emoções como raiva, dor, surpresa ou incredulidade. O espectograma apresentado na Figura 7 mostra o aumento de F0 na sentença <ai bosta //$> que chegou a alcançar uma F0 de 270,8 Hz e uma intensidade de 76,52 dB.

Figure 7. FIGURA 7 – Onda sonora, espectograma e curva de F0 e intensidade da TCU das linhas 125 e 126 do Trecho (2) do Arquivo “bfamcv05” do C-ORAL-BRASIL I . Fonte: elaborado pela autora

Nas linhas 127, 128 e 129 observa-se falas sobrepostas que traduzem as regras que fornecem uma ordem para aplicabilidade das técnicas de alocação de turnos. São elas: (3) Ocorrências de mais de um falante por vez são comuns, mas breves, (6) o tamanho dos turnos não é fixo, mas variável, (7) a extensão da conversa não é previamente especificada e (8) o que cada um diz não é previamente especificado (SACKS; SCHEGLOFF; JEFFERSON, 2003[10]).

A Figura 8 mostra as curvas entonacionais das sobreposições realizadas pelos interactantes quando (MAR) enuncia <Nossa Senhora / cê quebrou minha> [/1] meu +$> no mesmo instante em que (JOS), até então, evolvido com a jogada, enuncia <quê //$, nem encostei> n' ocê / varão //$>.

Figure 8. FIGURA 8 – Onda sonora, espectograma e curva de F0 e intensidade da TCU das linhas 127 e 128 e 129 do Trecho (2) do Arquivo “bfamcv05” do C-ORAL-BRASIL I . Fonte: elaborado pela autora

No Trecho (2) nota-se, também, que (JOS), até então, evolvido com a jogada, alterou o contorno entonacional nos enunciados das linhas 128 e 129, <quê>, <nem encostei> n' ocê / varão //$> para sobrepor a fala de (MAR), manifestando uma surpresa por não acreditar que havia contundido seu adversário. De acordo com Schegloff et al. (2003, p. 43), a expressão “quê” (what) pode ser considerada “o começo de uma construção sentencial ou clausal ou sintagmática feita não através da sintaxe, mas da entonação”. Neste cenário, a Figura 9 mostra que a expressão <quê //$>, que chegou a alcançar uma F0 de 273,3 Hz e uma intensidade de 76,76 dB, é uma fronteira prosódica que, além de também marcar o aumento de F0 e o TRP, revela uma mudança de footing realizada a partir de uma estrutura de expectativa que envolve um enquadre interativo e um esquema de conhecimento manifestado por (JOS) na tentativa de responder à pergunta: “o que está acontecendo aqui e agora?”.

Figure 9. FIGURA 9 – Onda sonora, espectograma e curva de F0 e intensidade da TCU das linhas 128 e 129 do Trecho (2) do Arquivo “bfamcv05” do C-ORAL-BRASIL I . Fonte: elaborado pela autora

Assim como a TCU observada na linha 75 do Trecho (1) do arquivo “bfamcv02”, quando (RUT) enunciou <nũ me convida pa ser Epa [/1] madrinha não / hein //$>, a TCU da linha 129 <nem encostei> n' ocê / varão //$> também foi construída a partir de um movimento ascendente na região pré-nuclear do contorno entonacional característico de sentenças declarativas marcadas por movimento entonacional descendente na região pré-nuclear do contorno melódico, Bolinger (1984).

Podemos afirmar que as TCUs construídas nas linhas 128 e 129 apresentaram uma sequencialidade defendida pela regra (13) “várias unidades de construção de turno são empregadas para a produção da fala que ocupa um turno” (SCHEGLOFF et al, 2003, p. 40). Essa sequencialidade é um recurso analítico da AC que, segundo Couper-Kuhlen e Selting (2018, p. 328[13]) “they are typically organized around a base adjacency pair, the one whose actions underlie the sequence as a whole”.

As análises foram realizadas a partir de aspectos sociointeracionais e suprassegmentais e os resultados apontaram que o TRP verificado nas TCUs elaboradas nas duas situações comunicativas escolhidas para este artigo provoca mudanças de footing.

5. Conclusão

Destaco que os fragmentos analisados mostraram a estreita relação existente entre a AC e a LI e a SI, uma vez que, ilustraram justamente as ações e as sequências que foram complementadas e tornadas interpretáveis pelo sistemático uso de recursos linguísticos, além de explicitar a “simultaneidade de falas” (MARCUSCHI, 2003, p. 23[2]), e obedecer à algumas técnicas de alocação de turno apresentadas por Sacks, Schegloff e Jefferson (2003[10]).

Pautando-me nas considerações de alguns pesquisadores, entre eles Couper-Kuhlen e Selting (2018[13]), Goffman (1972; 1974; 1798; 1981), Gumperz (1982; 1989), Tannen e Wallat, (1987[15]), Hirst e Di Cristo (1998[6]), Bolinger (1986[7]), Halliday (1967[8]) e Robert D. Ladd (1996[9]) pude também constatar que as estratégias utilizadas pelos interactantes das duas situações comunicativas promoveram a alternância contextualmente organizada entre os papéis de falante e ouvinte, assegurando a sequencialidade da interação e o desenvolvimento dos tópicos discursivos, dos fatores extralinguísticos, não linguísticos, contextuais, situacionais e prosódicos envolvidos nos processos de projeção, finalização de turno e TRP. Isto corrobora a afirmação de Goffman (1974[1]) quando declara que uma sentença utiliza um segmento prosódico para direcionar a sua estruturação sintática e, inclusive, para servir como guia da interpretação.

Estes resultados podem ser verificados no Trecho (1), por exemplo, que mostra que o momento propício da alternância de turno, ou seja, o TRP, ocorreu na TCU da linha 73, <pelo amor de Deus>, quando (RUT) aumentou a F0 e a intensidade para sobrepor a fala de (TER) e, em seguida, enunciar na linha 75 <nũ me convida pa ser Epa [/1] madrinha não / hein //$>, determinando seu posicionamento, sua postura e, ao mesmo tempo, negociando esse alinhamento para esclarecer que não aceitaria um possível convite para ser madrinha de casamento. Já no Trecho (2), o TRP e a mudança de footing ocorreram quando (JOS) revelou uma atitude de surpresa ou incredulidade ao enunciar <quê //$> na linha 128. Na sequência, (JOS) também alterou seu comportamento linguístico ao elevar F0 e a intensidade para sobrepor a fala do seu adversário e negar a investida ao enunciar na linha 128 e 129 <nem encostei> n' ocê / varão //$>.

Além disso, tanto no trecho (1) quanto no Trecho (2) encontramos sentenças declarativas que, por padrão, são construídas a partir de um movimento ascendente na região pré-nuclear do contorno entonacional marcadas por movimento entonacional descendente no final da sentença, Bolinger (1984). As análises mostraram ainda que algumas TCUs apresentaram informações ainda não compartilhadas que, de acordo com Hallyday (1967[8]), trazem algo novo ao contexto interacional. No Trecho (1) o foco informacional foi a recusa de (RUT) em ser madrinha de casamento da filha de (TER) e no Trecho (2) a contusão sofrida por (MAR). Salientamos que o correlato prosódico do foco informacional do PB analisado nesta pesquisa é o aumento de pitch observado nos TRPs das TCUs analisadas.

Considerando o objetivo proposto neste artigo, os resultados apontaram que os TRPs, verificados nas TCUs elaboradas pelas duas situações comunicativas escolhidas para este estudo, foram marcados por variações prosódicas mensuradas a partir da F0 e intensidade e provocaram mudanças de footing realizadas, na maioria dos enunciados, através de funções discursivas, expressivas e atitudinais que geralmente são construídas a partir de aumento de F0 e intensidade.

Neste artigo limitei-me à uma proposta de investigação de apenas dois arquivos do corpus. Devido a esse fato, os resultados deste estudo são de natureza preliminar. O C-ORAL-BRASIL I possui 139 textos com 21h08min52s de gravação de fala espontânea e um total de 208.130 palavras, essa arquitetura possibilita uma ampliação deste estudo, seja a nível prosódico ou sociointeracional, pois as interações são diversificadas e favorecem a investigação de vários fenômenos linguísticos.

Referências

AUSTIN, John. Sense and Sensibilia. Londres: Cambridge University Press. Vol. 38, n. 145, p. 242-252, 1963.

BARBOSA, Thalita S. V. Sobreposição de fala em diálogos: um estudo fonético-acústico. 2015. 109 f. Dissertação (Mestrado em Estudos da Linguagem) – UNICAMP, Universidade Estadual de Campinas, Campinas, 2013.

BOLINGER, D. Intonation end its parts. London: Edward Arnold Publishers, 1986.

BRAIT, Elisabeth. O processo interacional. In: PRETI, Dino (org.) Análise de Textos Orais. São Paulo: Projeto NURC/SP – FFLCH-USP, 4 ed., p. 189-214, 1993.

CAGLIARI, Luis Carlos. Análise fonológica: introdução à teoria e à prática. Campinas: Mercado das Letras, 2002.

CHAFE, W. Creativity in verbalization and its implications for the nature of stored knowledge. In: FREEDLE, R (Org.). Discourse production and comprehension. Norwood, New Jersey: Ablex, p. 41-55, 1977.

COSERIU, Eugênio. Fundamentos e tarefas da sócio e etnolinguística. In: MELLO, Linalda Arruda. (Org.). Sociedade, Cultura e Língua: Ensaios de Sócio e Etnolinguística. João Pessoa: Shorin, 1990.

DU BOIS, John W. The stance triangle. In: ENGLEBRETSON, Robert (org.). Stancetaking in discourse: subjectivity, evaluation, interaction. Amsterdam: Benjamins, p. 139–182, 2007. https://doi.org/10.1075/pbns.164.

DU BOIS, John W.; KÄRKKÄINEN, Elise. Taking a stance on emotion: affect, sequence, and intersubjectivity in dialogic interaction. Text & Talk, vol. 32, p. 433–451, 2012. https://doi.org/10.1515/text-2012-0021.

FRAKE, C. O. The ethnographic study of cognitive systems. In: TYLER, S. A. (Org.). Cognitive anthropology. New York: Holt, Rinehart & Winston, p. 28-41, 1969.

FRENCH, P.; LOCAL, J. Turn-competitive incomings. In: Journal of Pragmatics, vol.7, p. 701-715, 1983.

FILMORE. C. J. Proceeding of the First Annual Meeting of the Berkeley Linguistics Society. Berkeley: Linguistics Department, University of California, p. 123-132, 1975.

FORD, C.; FOX, B.; THOMPSON, S. The language of turn and sequence. Oxford: Oxford University Press, 2002.

FORD, C.; FOX, B.; THOMPSON, S. Practices in the construction of turns: The “TCU” revisited. Pragmatics, vol. 6, n. 3, p. 427–454, 1996. https://doi.org/10.1075/prag.6.3.07for.

GOFFMAN, Erving. Frame analyses. Reprint. Originally published: New York: Harper E Row, 1974.

GOFFMAN, Erving. Footing. In: RIBEIRO, B. T.; GARCEZ, P. M. (Orgs.) Sociolinguistica Interacional. São Paulo: Edições Loyola, 2013, p.107-148.

GONÇALVES, Sineide. As práticas discursivas de Marília Gabriela em entrevistas com atores considerados galãs da TV brasileira. 2015. 114 f. Dissertação (Mestrado em Estudos Linguísticos) – ICHS, Universidade Federal de Ouro Preto, Mariana, 2015.

GUMPERZ, J. J. Discourse strategies. Cambridge University Press, 1982.

HALLIDAY, M. A. K. Intonation in english grammar. In: Transactions of the phylological society, p. 143-169, 1964. https://doi.org/10.1111/j.1467-968X.1963.tb01003.x.

HIRST, Daniel; CRISTO, Di Albert. Intonation systems: A survey of twenty languages. United Kingdon: Cambridge University Press, 1998. https://www.researchgate.net/deref/http%3A%2F%2Fdx.doi.org%2F10.1353%2Flan.2000.0088.

HIRST, D. Form and Function in the Representation of Speech Prosody. Speech Communication, 46, pp. 334-347, 2005.

HYMES, D. Ways of speaking. In: BAUMAN, R.; SHERZER, J. (Orgs.) Explorations in the ethnography of speaking. Cambridge: Cambridge University Press, p. 433-51, 1974.

JAMES, W. Principles of psychology. New York: Dover, 1950, Vol. 2, p. 292-293.

JEFFERSON, G. Preliminary Notes on a possible metric which provides for a ‘standard maximum’ silence of approximately one second in conversation. In: ROGER, D.; BULL, P. (Orgs.). Conversation, and Interdisciplinary perspective. Clevedon Multilingual Matters Ltd, Vol.3, p. 166-196. 1989.

LADD, D. R. Intonational Phonology. 2nd edition. New York: Cambridge University Press, 2008.

LEITE, Délia Ribeiro. Estudo prosódico sobre as manifestações de foco. 2009. 146 f. Dissertação (Mestrado em Estudos Linguísticos) – UFMG – Universidade Federal de Minas Gerais, Belo Horizonte, 2009.

LEVINSON. S. Pragmática. São Paulo: Martins Fontes, 2007.

MARCUSCHI, L. A. Perspectivas dos estudos em interação na Linguística brasileira dos anos 90. Recife: (mimeo), 1998.

MARCUSCHI, Luiz A. Análise da conversação. 5 ed. São Paulo: Editora Afiliada, 2003.

MARCUSCHI, Luiz Antônio. Produção textual, análise de gêneros e compreensão. São Paulo: Parábola Editorial, 2008.

MINSKY, M. A framework for representing knowledge. In: WINSTON, P. H. (Org.). The psychology of computer vision. New York: McGraw Hill, p. 211-277, 1975.

PIKE, K. L. The Intonation of American English. Ann Arbor: The Michigan University Press, 1945.

RASO, T.; MELLO, H. R. (Eds.). C-ORAL-BRASIL I: Corpus de referência do português

brasileiro falado informal. Belo Horizonte: Editora UFMG, 2012.

RASO, T.; MITTMANN, M. M. As principais medidas da fala. In: RASO, T.; MELLO, H. R. (Eds.). C-ORAL-BRASIL I: Corpus de referência do português brasileiro falado informal. Belo Horizonte: UFMG, 2012.

RIBEIRO, B. T.; GARCEZ, P. M. (org.). Sociolinguística Interacional. Porto 3 Ed. São Paulo: Edições Loyola, 2013.

RUMELHART, D. E. Notes on a schema for stories. In: D. C. Bobrow & A. Collins (Orgs.). Representation and understanding. New York: Academic Press, p. 211-236, 1975.

SACKS, Harvey; SCHEGLOFF, Emanuel A.; JEFFERSON, Gail. Sistemática Elementar para a organização da tomada de turnos para a conversa. Juiz de Fora: Veredas, v. 7, n. 1-2, 2003. Tradução de Maria Clara Castellões de Oliveira. Language, 1974, v. 50, p. 696-735. A Simplest Systematic for the Organization of Turn taking for Conversation.

SCHANK, R. C.; ABELSON, R. P. Scripts, plans, goals, and understanding: an inquiry into human knowledge structures. Hillsdale, New Jersey: Erlbaum, 1977.

SCHEGLOFF, E.A. Reflections on Studying Prosody in Talk-in-interaction. In: Language and Speech. California: University of California, vol.41, p. 235-263, 1998. https://doi.org/10.1177%2F002383099804100402.

SCHEGLOFF, Emanuel A. Sequence Organization in Interaction. v.1, Cambridge: Cambridge University Press, 2007.

SCHUTZ, Alfred. Símbolo, realidade e sociedade. In: NATANSON, Maurice (Ed.). Artigos coletados: O problema da realidade social. The Hague: Nijhoff, vol. I, p. 287-356, 1962.

SELTING et al. Um sistema para transcrever a fala-em-interação: GAT 2. Veredas atemática. Juiz de Fora. V. 20, n. 2, p. 06-61. 2016.

SELTING, Margret; COUPER-KUHLEN, Elizabeth. Studies in Interational Linguístics. New Kingdon: Cambridge University Press, 2018.

SELTING, Margret, AUER, Peter, BARTH-WEINGARTEN, Dagmar, BERGMANN, Jörg, BERGMANN, Pia, BIRKNER, Karin, COUPER-KUHLEN, Elizabeth, DEPPERMANN, Arnulf, GILLES, Peter, GÜNTHNER, Susanne, HARTUNG, Martin, KERN, Friederike, MERTZLUFFT, Christine, MEYER, Christian, MOREK, Miriam, OBERZAUCHER, Frank, PETERS, Jörg, QUASTHOFF, Uta, SCHÜTTE, Wilfried, STUKENBROCK, Anja, UHMANN, Susanne. Gesprächsanalytisches Transkriptionssystem 2 (GAT 2). Gesprächsforschung 10, p. 353-402, 2009. Disponível em: www.gespraechsforschung-ozs. acessado em outubro de 2019.

TANNEN, Deborah; WALLAT, Cynthia. Enquadres interativos e esquemas de conhecimento em interação: Exemplos de um exame/consulta médica. In: RIBEIRO, Branca Telles; GARCEZ, Pedro M. (Orgs.). Sociolinguística Interacional. 2 ed. São Paulo: Edições Loyola, 2013, cap. 7, p. 183-214.

WELLS, B.; MACFARLANE, S. Prosody as an Interactional Resource: Turn-Projection and Overlp. In: Language and Speech. Cambridge: Cambridge University Press, vol. 41, no. 3-4, p. 265-294, 1998. https://doi.org/10.1177%2F002383099804100403.

WITTGENSTEIN, L. Tractatus logico-philosophicus. São Paulo: Editora da USP, 1922.