<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.2 20190208//EN" "JATS-archivearticle1.dtd">
<article xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:ali="http://www.niso.org/schemas/ali/1.0">
  <front>
    <article-meta>
      <article-categories>
        <subj-group>
          <subject content-type="Tipo de contribuição">Artigo</subject>
        </subj-group>
      </article-categories>
      <title-group>
        <article-title>ANÁLISE    AUTOMÁTICA   DA     MORFOLOGIA VERBAL DO PB: PLATAFORMA CHILDES</article-title>
      </title-group>
      <contrib-group content-type="author">
        <contrib id="person-d1f15a76832491056ec76dfe1b696b6b" contrib-type="person" equal-contrib="no" corresp="yes" deceased="no">
          <name>
            <surname>Sciliar-Cabral</surname>
            <given-names>Leonor</given-names>
          </name>
          <xref ref-type="aff" rid="affiliation-65633c78e7f6822b50564e50b17fa55f" />
        </contrib>
        <contrib id="person-7eeaf4ec891fe05884dc1d452653cb6a" contrib-type="person" equal-contrib="no" corresp="yes" deceased="no">
          <name>
            <surname>Vasilévski</surname>
            <given-names>Vera</given-names>
          </name>
          <xref ref-type="aff" rid="affiliation-b9f02eedd973d7085a3a0f9eb92153ef" />
        </contrib>
      </contrib-group>
      <aff id="affiliation-65633c78e7f6822b50564e50b17fa55f">
        <institution content-type="orgname">Universidade Federal de Santa Catarina (UFSC)/CNPq</institution>
      </aff>
      <aff id="affiliation-b9f02eedd973d7085a3a0f9eb92153ef">
        <institution content-type="orgname">(PNPD CAPES)</institution>
      </aff>
      <pub-date date-type="pub" iso-8601-date="31/12/2011" />
      <volume>10</volume>
      <issue>3</issue>
      <fpage>431</fpage>
      <lpage>444</lpage>
      <page-range>431-444</page-range>
      <permissions id="permission">
        <license>
          <ali:license_ref>http://creativecommons.org/licenses/by/4.0/</ali:license_ref>
        </license>
      </permissions>
      <abstract>
        <p id="_paragraph-1">
          <italic id="italic-6a26453ead730e305da1567bdbbbd3cd">Os procedimentos de montagem das regras que compõem o aparato para a análise automática da morfologia verbal do PB, dentro da plataforma CLAN, serão apresentados e debatidos. Comparando-se a formalização das classes sintáticas e respectivas regras do espanhol e do italiano com as do PB, chegou-se à conclusão de que elas deveriam ser reformuladas, particularmente no que diz respeito à análise automática dos morfemas verbais. Tendo em vista o nível de previsibilidade dos morfemas do sistema de verbos do PB, apresenta-se a formalização das regras morfológicas que compõem esse sistema para os verbos regulares das três conjugações e a formalização em algoritmo, bem como o trabalho que a antecedeu na programação informatizada que identifica automaticamente as formas verbais do português, classificando-as segundo modo/tempo, pessoa/número, em compatibilidade com o sistema CLAN, da plataforma CHILDES (MacWHINNEY, 2000, 2008). Discutem-se as dificuldades encontradas na conversão e as decisões que foram tomadas para superá-las e mostra-se a criação automática de uma linha fonológica. Este trabalho é realizado com apoio do CNPq e da CAPES, entidade do governo brasileiro voltada para a formação de recursos humanos.</italic>
        </p>
      </abstract>
      <abstract abstract-type="executive-summary">
        <title>Abstract</title>
        <p id="_paragraph-2">
          <italic id="italic-1">Os procedimentos de montagem das regras que compõem o aparato para a análise automática da morfologia verbal do PB, dentro da plataforma CLAN, serão apresentados e debatidos. Comparando-se a formalização das classes sintáticas e respectivas regras do espanhol e do italiano com as do PB, chegou-se à conclusão de que elas deveriam ser reformuladas, particularmente no que diz respeito à análise automática dos morfemas verbais. Tendo em vista o nível de previsibilidade dos morfemas do sistema de verbos do PB, apresenta-se a formalização das regras morfológicas que compõem esse sistema para os verbos regulares das três conjugações e a formalização em algoritmo, bem como o trabalho que a antecedeu na programação informatizada que identifica automaticamente as formas verbais do português, classificando-as segundo modo/tempo, pessoa/número, em compatibilidade com o sistema CLAN, da plataforma CHILDES (MacWHINNEY, 2000, 2008). Discutem-se as dificuldades encontradas na conversão e as decisões que foram tomadas para superá-las e mostra-se a criação automática de uma linha fonológica. Este trabalho é realizado com apoio do CNPq e da CAPES, entidade do governo brasileiro voltada para a formação de recursos humanos.</italic>
        </p>
      </abstract>
    </article-meta>
  </front>
  <body id="body">
    <sec id="heading-c35c34092749cd93b62cdcc5a0c3dbd7">
      <title>1. Histórico</title>
      <p id="paragraph-1">O Grupo Integrado Produtividade Linguística Emergente do CNPq há anos vem alimentando o maior banco mundial de dados de linguagem verbal, a plataforma CHILDES, conforme pode ser visualizado e ouvido no site: http:/childes.psy.cmu.edu/data/Romance/Portuguese/ florianopolis.zip, uma vez que todos os enunciados, tanto dos adultos quanto os da criança são seguidos de <italic id="italic-bdece7b6e02867a7bd9d1e06b1fb6a36">bullets </italic>que, quando clicados permitem sua audição. Há três corpora, correspondentes à fase 1 (20m e 21d), à fase 2 (22m e 20d) e à fase 3 (26m e 08d) do sujeito Pá, cujos enunciados também foram transcritos foneticamente (<italic id="italic-2">broad transcription</italic>). O principal achado da pesquisa foi considerar o acento de intensidade como morfema verbal (suprafixo), com a função de assinalar na 1ª fase diferenças aspectuais (posteriormente, redundante e cumulativamente também assinalará tempo/modo). Propusemos, então a implementação1 da fórmula de Mattoso Camara Jr. (2004:134) que passa a: <bold id="bold-1">T(R+VT) + </bold><bold id="bold-2">SF (SMTA+SNP +SPF)</bold>.</p>
      <p id="paragraph-2">O mundo contemporâneo dos computadores e da linguística computacional tornou possível a catalogação e análise de uma quantidade antes nunca conhecida de dados da comunicação verbal, em tempo muito menor. Isto possibilita comparações e generalizações a partir de uma massa de dados muitíssimo mais robusta. A base de dados da plataforma CHILDES, com a qual o presente projeto opera, contém 44 milhões de palavras faladas em 28 línguas diferentes. Trata-se do maior <italic id="italic-3">corpus </italic>de fala atualmente existente. Em segundo lugar, vem o <italic id="italic-4">British National Corpus</italic>, com 5 milhões de palavras.</p>
      <p id="paragraph-3">Todos os dados do sistema CHILDES estão codificados de forma consistente num formato de transcrição denominado CHAT, inclusive os dados da 3ª fase do sujeito Pá, dos quais será depreendida a gramática automática. Atualmente já foram construídas gramáticas MOR de 10 línguas: cantonês, holandês, inglês, francês, alemão, hebraico, japonês, italiano e espanhol, das quais servirão de modelo para a depreensão da gramática do PB as gramáticas do italiano e do espanhol e as de linguistas brasileiros (Bechara (1999); Borba <italic id="italic-d05da06d4809d9293b07f55633a508f7">et al</italic>. (2002); Castilho (1989, 2002a e b); Cunha &amp; Lindley-Cintra (1987); Ilari (2002); Ilari &amp; Basso _____<underline id="underline-1"> </underline>(2006); Kato (2002); Koch (2002); Mattos e Silva (2001); Moura Neves (2000, 1999); Naro; Scherre (1993); Preti (1993); Roncarati &amp; Abraçado (2003))<xref id="xref-dda63a44e3a166a88fe98b85109aa21d" ref-type="fn" rid="footnote-6144cf282169a273606793f26bb4b205">1</xref>.</p>
      <p id="paragraph-4">O projeto ora apresentado tem como principal meta colocar à disposição dos pesquisadores uma ferramenta que lhes possibilite a análise morfológica automática dos enunciados que constituem os <italic id="italic-ec408dc96c264d2069bb4113b568ef79">corpora </italic>coletados do PB.</p>
      <p id="paragraph-5">O Grupo Integrado do CNPq, Produtividade Linguística Emergente, já realizou a análise morfológica manual dos enunciados da criança, nas fases 1 e 2, exemplificados a seguir:</p>
      <p id="paragraph-66af5c8669ebcf1576e66a4e17f5f486">Fase 1 (20m e 21d):</p>
      <p id="paragraph-de69a36ff4f9da890c8b3cd8dc9dcd41">47 *CHI: &lt;não é&gt; [&gt;]!</p>
      <p id="paragraph-06b767f1c8bce8767c72ac34752cb30d">48 %pho: ´nǩ̃w ´s</p>
      <p id="paragraph-c53e903a3d7a6d47971faf821daaa2ce">49 %mor: neg|não=not v:cop1|s-TV2&amp;IPFVM1=is!</p>
      <p id="paragraph-c1100cd03dc5b448ab21d1a01585db41">A linha 47 é a linha principal (<italic id="italic-aae03ef2b96e83a01801fea71d5f6b49">main line</italic>), contendo um enunciado com dois itens da criança (CHI); a linha 48 %pho é a transcrição fonética e a linha 49 %mor é a análise morfológica manual, em que cop1 é a cópula 1, cujo radical do verbo ser é s-, com a vogal temática da 2ª conjugação, no imperfectivo (as pessoas do discurso ainda não estão gramaticalmente assinaladas).</p>
      <p id="paragraph-fd26191e990a585f6798028e7b7a9b5c">Fase 2 (22m e 20d):</p>
      <p id="paragraph-42c308363f9d3031422e4d643a039f7a">52 *CHI: cadê ota [= outra] cadeira?</p>
      <p id="paragraph-115b0920e0174fe94bbcfeb775b9ccee">53 %pho: ka´de ´ota ka´derŞ</p>
      <p id="paragraph-47c57443c6fd7c6420c17e350cff9105">54 %mor: wh:proloc|cadê=where det|ota=another n|cadeira=chair?</p>
      <p id="paragraph-bf561a2dc92e62168ec8f941a2666a8a">Uma formalização semelhante, porém, expressando a gramática do PB, será o <italic id="italic-bc2262723cf93466e3201011720b2432">output </italic>na linha %mor, quando for disponibilizada a gramática automática para análise de <italic id="italic-7d96f032c97d3c333e698e6b64f9a4a6">corpora </italic>formatados de acordo com o formato CHAT.</p>
    </sec>
    <sec id="heading-3d41431d0e33219f78584b6cfcac8e89">
      <title>2. Codificação dos paradigmas das classes sintáticas </title>
      <p id="paragraph-8bbf014a188cde2f76b3ea727bf23212">Para a preparação da gramática automática, cujas regras e respectivos algoritmos dos tempos simples dos verbos regulares serão explicados nesse artigo, já foram codificados os paradigmas das classes sintáticas, a seguir exemplificados:</p>
      <p id="paragraph-771f80cf344bc10a1ffc4ef9174ed724">
        <bold id="bold-82891b296b63a137a0e8a16e8698c1e8">Advérbios interrogativos</bold>
      </p>
      <p id="paragraph-007f8f9421f5b5b62350966039c85fe4">onde {[scat adv:int]} =where=</p>
      <p id="paragraph-0cf92af58d6ac21f82d9c84f0998d466">
        <bold id="bold-153c08e7b5ca452dad960c24c5985c92">Artigos</bold>
      </p>
      <p id="paragraph-6b83e04120ba435e67c566ccbfda9b8d">a {[scat art]} “o&amp;FEM&amp;SG” =the=</p>
      <p id="paragraph-4d65ff1568fc7cb730f82e12aea2c3e4">
        <bold id="bold-8db1bb65d64562864c8b560344011c4d">Pronomes adjetivos demonstrativos</bold>
      </p>
      <p id="paragraph-6">aquela {[scat det:dem] “aquele&amp;FEM&amp;SG” =that=</p>
      <p id="paragraph-d1f1e9c12a091e762a205bc22db6b62c">
        <bold id="bold-3f53badf2940dab9d2bfeed441aab5a2">Pronomes adjetivos indefinidos</bold>
      </p>
      <p id="paragraph-8">algum {[scat det:indef]} “algum&amp;MASC&amp;SG”=some=</p>
      <p id="paragraph-89ace0b59cfc5e3c63b013961a8fb579">
        <bold id="bold-3775b2ab96181e5fb40bfb15977f182e">Pronomes adjetivos interrogativos</bold>
      </p>
      <p id="paragraph-10">que {[scat det:int]} =what=</p>
      <p id="paragraph-df7418b9557f3393e67800456a096282">
        <bold id="bold-eb7e3675eab95a24eecb038b13e1f263">Pronomes adjetivos possessivos</bold>
      </p>
      <p id="paragraph-12">meu {[scat det:poss]} “meu-1S&amp;MASC&amp;SG” =my=</p>
      <p id="paragraph-3879356c71a2bcfd528361d7de7d5ea6">
        <bold id="bold-ece83e452cdfa8caaf0a29e2db60fe4d">Pronomes substantivos demonstrativos</bold>
      </p>
      <p id="paragraph-14">a {[scat pro:dem] “o&amp;FEM&amp;SG” =in English it is included in wh form=</p>
      <p id="paragraph-dba9f27b152b98ebe0f51e5685a0618b">Pronomes substantivos indefinidos</p>
      <p id="paragraph-ea3a68548aa685bed91798254e372e4b">algo {[scat pro:indef]} =something=</p>
      <p id="paragraph-2faa81cc0c2587c26978411f545a86f9">
        <bold id="bold-f02cbabf9107851458e3abee38e0ee6d">Pronomes substantivos interrogativos</bold>
      </p>
      <p id="paragraph-d97d1b687073647f59677ff4b6e72a74">o_que {[scat pro:int]} =what=</p>
      <p id="paragraph-c2c49ed32b73cc9643ace2ea7be59863">
        <bold id="bold-5bbf9fa2ed1cccd043a47a2cbe0a5455">Pronomes pessoais</bold>
      </p>
      <p id="paragraph-95bb3837acb86fef88897edf46dd476a">% subject case</p>
      <p id="paragraph-ad1f303dc52be39f7e2692dab56ef1f7">eu {[scat pro:pers]} “eu&amp;1S&amp;SUBJ” =I=</p>
      <p id="paragraph-7">% forms that are the same as subject and object (in the last case, always preceded by preposition)</p>
      <p id="paragraph-173a61ea7cbb4915f2698f5f126ff160">você {[scat pro:pers]}”você&amp;2S&amp;SG&amp;OBJ” =you=</p>
      <p id="paragraph-9">% clitics</p>
      <p id="paragraph-ad0a2c9a0908569e96dd398d5cac319c">me {[scat pro:pers]} “eu&amp;1S&amp;OBJ” =me=</p>
      <p id="paragraph-cdbd897344e122fb2f391216d06df9d3">
        <bold id="bold-826b86ed7180958774f6228335b96fbb">Pronomes substantivos possessivos</bold>
      </p>
      <p id="paragraph-39f07e6b5b62640e7eae25164fee4fdc">minha {[scat pro:pos]} “meu-1S&amp;FEM&amp;SG” =mine=</p>
      <p id="paragraph-0460a263679761f1f7d6100b56b430e3">
        <bold id="bold-3f0df2d75e43c9321423c6a45553b7e5">Pronome relativo</bold>
      </p>
      <p id="paragraph-4633410ec3820bdf0f2660ad6d93d777">quem {[scat pro:rel]} =who=</p>
      <p id="paragraph-c9482ac0a48b2c63359686ab810fddea">
        <bold id="bold-5c89d23eab7a359507cee51feddd26b3">Preposições</bold>
      </p>
      <p id="paragraph-16">a {[scat prep]} =to=</p>
      <p id="paragraph-3e6a393b4f22f3f851c091251e26b85e">
        <bold id="bold-15ac32bd2a39f3fb904f6db6d1c5952f">Preposições + determinativos</bold>
      </p>
      <p id="paragraph-18">à {[scat prep]} «a~det:art|o&amp;FEM&amp;SG» =to the=</p>
      <p id="paragraph-40740ea5b521825c68b7afee149da00e">
        <bold id="bold-7ab8c68513b7b99a665ee50e2d53c046">Preposições + pronomes substantivos demonstrativos</bold>
      </p>
      <p id="paragraph-20">à {[scat prep]} «a~pro:dem|o&amp;FEM&amp;SG» =to the one=</p>
      <p id="paragraph-3d546919f872ce6dca5f809f337f2811">Conjunções coordenativas</p>
      <p id="paragraph-d5d00f18ee95731e4e0f654dd986b213">contudo {[scat conj:coor ]} =nevertheless=</p>
      <p id="paragraph-53ae60fa8207977fa4701ec0bd38d0e0">
        <bold id="bold-21e205bde2a54fa73a1858cb31665f7c">Conjunções subordinativas</bold>
      </p>
      <p id="paragraph-b8a9e59237c22f45e135c4edcef1590d">antes_que {[scat conj:sub ]} =before=</p>
      <p id="paragraph-ce1d9a27747ae36467a42c8bbf6b3078">
        <bold id="bold-4a06da4fd3262818b780f97fba77e00f">Substantivos comuns</bold>
      </p>
      <p id="paragraph-4426e1018bf7472e453dccde0dee57d2">adultos {[scat n][gen masc]} “adulto-PL” =adults=</p>
      <p id="paragraph-1f29c01b700cd0e929d164daa50e45e9">
        <bold id="bold-011485f2b76e317133a35b364b6e1b5c">Substantivos próprios</bold>
      </p>
      <p id="paragraph-2ca1db9c08d247481e73f70958d83a7a">Ana {[scat n][gen fem]}</p>
      <p id="paragraph-99e8b6d91914a0d282b59caa3ca65b0c">Uma solução para equacionar o difícil problema da delimitação das locuções, cujos termos vêm ligados por _, é aplicar o teste da impossibilidade de separá-los pela interpolação de outra palavra. O critério não foi aplicado para os tempos compostos e locuções verbais, uma vez que seus respectivos auxiliares são arrolados em paradigma específico. Veja-se, a seguir, um exemplo de codificação de locução adverbial listada no <italic id="italic-41ec57bec50b224d1a9da89022f38ed7">corpus </italic>PAU003:</p>
      <p id="paragraph-2f024053c7c45bc6600b1e5b456ec743">
        <bold id="bold-2012bcce162b957d508f68256600599c">Locuções adverbiais</bold>
      </p>
      <p id="paragraph-11">ao_mesmo_tempo {[scatadv:loc]} =at_the_same_time=</p>
      <p id="paragraph-13">A seguir serão apresentadas as ferramentas produzidas por Vera Vasilévski, utilizadas pelos pesquisadores do Grupo Integrado Produtividade Linguística Emergente, como auxiliares na depreensão da gramática automática do PB.</p>
    </sec>
    <sec id="heading-1b33f7daab5d3d085f313f0eaa13806f">
      <title>3. Trajetória</title>
      <p id="heading-6045bcf6dd13bc2d2ec5e7f43ab735d8">Em 2008, como resultado da tese de doutorado <italic id="italic-2f20bf4b6a2da5231a00255efbdbc1e0">Criação do Sistema de Conversão Grafema-fonema Nhenhém</italic>, foi criado o programa de conversão grafêmico-fonológica automática <bold id="bold-26eb4e3bfd0c2bcb286c3e8e35905c38"><italic id="italic-9f3304e67be3d383d0f2ca1db458c91f">Nhenhém </italic></bold>e, em 2009, a primeira atualização. Em 2010 ocorreu a conversão do Nhenhém para outra linguagem de programação, a criação do Nhenhém silabador, a versão atualizada do Nhenhém silabador (entrada da morfologia, na separação silábica de palavras compostas por justaposição) e a Interface entre o Nhenhém e os arquivos Clan.</p>
      <p id="paragraph-2aa0b7c53c0c4a8a31c9cab57ba244b2">A interface entre o programa Clan foi feita com um programa específico criado para auxiliar o trabalho dos bolsistas do projeto. Chama-se LAÇA-PALAVRAS e abriga os demais programas e funções, além de ler os arquivos do Clan.</p>
      <p id="paragraph-b0c030cf5a3d400b400684e78e5d6c8f">A interface ocorre em dois níveis: manipulação de conteúdo (lê os dados e os dispõe em estatística, sem alterar o arquivo original) ou interferência nos arquivos (modifica/edita-os) e, cria, simultaneamente a linha %pho, conforme o quadro abaixo:</p>
      <fig id="figure-panel-17c90ada3740935b4e6f3f66f216d9f2">
        <label>Figure 1</label>
        <caption>
          <p id="paragraph-16de5c2153aed05abdf47da9227822f6" />
        </caption>
        <graphic id="graphic-d2734864261f382dff5782be3d9f68f2" mimetype="image" mime-subtype="png" xlink:href="1_2.png" />
      </fig>
    </sec>
    <sec id="heading-ae633efa7bc656ae22f00e3273f12972">
      <title>4. Regras de alomorfia das VTs, dos SMT e SNP dos verbos regulares</title>
      <p id="heading-fdd55f03484a73359620b406cf7a5041">Como primeiro passo, foram formalizadas as regras de alomorfia das vogais temáticas (VT) das três conjugações dos verbos regulares, cujas ocorrências são marcadas na linha principal com @v, como, por exemplo, na linha 48 *CHI: acende@v a luz. Tais regras servem de base para o algoritmo para sua inserção no programa.</p>
      <fig id="figure-panel-52150a680922bbe69214be0a9190db06">
        <label>Figure 2</label>
        <caption>
          <p id="paragraph-2b633a187e1ee810433241a3cf1f0449" />
        </caption>
        <graphic id="graphic-c47f13cc1ac3adf818fa8b78bb3c1adb" mimetype="image" mime-subtype="png" xlink:href="2_2.png" />
      </fig>
      <p id="paragraph-c34314c92de999ae16733f9e31325217">A seguir, passou-se à formalização das regras de alomorfia do sufixo modo-temporal (SMT), conforme exemplo no quadro 3.</p>
      <fig id="figure-panel-48af3821d03eeba4f461fa81fc2230e4">
        <label>Figure 3</label>
        <caption>
          <p id="paragraph-076c6d157f340dc58771a11612d14481" />
        </caption>
        <graphic id="graphic-20b835489a4244df97135eccca01acc3" mimetype="image" mime-subtype="png" xlink:href="3_2.png" />
      </fig>
      <p id="paragraph-de3ae6b55ca203a17ff7b4f2297c2eb3">O <underline id="underline-0eb321bee7baf32f5e3216988c095426">presente do indicativo, como tempo primitivo</underline>, apresenta Æ para SMT.</p>
      <fig id="figure-panel-8db703541810a323b8a2408c25045733">
        <label>Figure 4</label>
        <caption>
          <p id="paragraph-ce44adc2299f9815e52bba44f968a70a" />
        </caption>
        <graphic id="graphic-46ff22cf5b3aa90d6851d392e1449cb4" mimetype="image" mime-subtype="png" xlink:href="4_2.png" />
      </fig>
      <p id="paragraph-e20705048b3653c607d42af4cc549fe2">O <underline id="underline-d22b7d224f88e730bf4e4330014372bb">pretérito perfeito do indicativo, como tempo primitivo, </underline>apresenta Æ para SMT, com exceção da 3ª pessoa do plural, -ra-, que é uma forma marcada.</p>
      <fig id="figure-panel-3a68c07a67d205b6e2608d3462db6ad7">
        <label>Figure 5</label>
        <caption>
          <p id="paragraph-923eb9f05b615aecc889f7701c934473" />
        </caption>
        <graphic id="graphic-749d5cc5413ece001bb45d09cce88ab8" mimetype="image" mime-subtype="png" xlink:href="5_2.png" />
      </fig>
      <p id="paragraph-0ef36e9d347327f3e945a272c5394c28">Finalmente, foram formalizadas as regras de alomorfia para o sufixo número-pessoal (SNP), das quais damos dois exemplos:</p>
      <fig id="figure-panel-41533e7fce12a950756d3a88f2facc21">
        <label>Figure 6</label>
        <caption>
          <p id="paragraph-ee30c23f879d579e76c54ba41cab4dcc" />
        </caption>
        <graphic id="graphic-0653676bbe2b062f75ed252f1e52538f" mimetype="image" mime-subtype="png" xlink:href="6_2.png" />
      </fig>
      <fig id="figure-panel-ff33ae4c5163e089a8f4610e024a75af">
        <label>Figure 7</label>
        <caption>
          <p id="paragraph-51e8d4dd07d1ced2a655100f6cc8c0bf" />
        </caption>
        <graphic id="graphic-3bd9820b32f2820b6325c217e412a276" mimetype="image" mime-subtype="png" xlink:href="7_2.png" />
      </fig>
      <fig id="figure-panel-52e5b0c7a2c199e720751697d62012a3">
        <label>Figure 8</label>
        <caption>
          <p id="paragraph-243913a6e44c0620ad9c419cdbae721a" />
        </caption>
        <graphic id="graphic-d74d950f322ae9322944c65b2b09df52" mimetype="image" mime-subtype="png" xlink:href="8_2.png" />
      </fig>
    </sec>
    <sec id="heading-2fb4fd6b3ff12c0a1d1e0f9a22c99b90">
      <title>Resultados</title>
      <p id="paragraph-096a137a9ed06dc782ac46db0b282fda">Conforme se pode depreender, encontra-se bastante adiantado o projeto de criação do programa que analisará automaticamente a morfologia do PB. Nesse ínterim, codificaram-se os paradigmas de quase todas as classes sintáticas, elaboraram-se as regras alomórficas das vogais temáticas e dos sufixos modo-temporais e número-pessoais do sistema escrito dos verbos regulares do PB, bem como foram construídas poderosas ferramentas de investigação como o programa Nhenhém (em várias versões), o silabador e o Laça-palavras, além dos algoritmos de conversão para linguagem de máquina, mas ainda teremos de resolver conflitos decorrentes das ambiguidades por meio de regras específicas.</p>
    </sec>
    <sec id="heading-43c532b36ffbfde299c723cd30823052">
      <title>Referências</title>
      <p id="paragraph-7bd8216fde7e50fe9cc74bb45c8f000e">BECHARA, E. <bold id="bold-c547283554f09881f092151b3e266f89">Moderna gramática portuguesa</bold>. 37ª ed. ver. e amp. Rio de Janeiro: Lucerna, 1999.</p>
      <p id="paragraph-9f966db39f8d367f16b2ef794557fd11">BORBA, F. S. <italic id="italic-78f78b0492df9d6bcddbcd0b742496d0">et al. </italic><bold id="bold-450a554a2141c1dce0e1d9faca7ce923">Dicionário de usos do português do Brasil</bold>. São Paulo: Ática, 2002.</p>
      <p id="paragraph-7a5f242899f35a27dd136f17e48b9cf6">CASTILHO, A. T. (Org.). <bold id="bold-3">Português culto falado no Brasil</bold>. Campinas: UNICAMP, 1989.</p>
      <p id="paragraph-3d94d68bf3f0c175b97321836883dd98">_______<underline id="underline-fb9af2dfa33bc41429594378e0df85f3"> </underline>. (Org.). <bold id="bold-4">Gramática do português falado</bold>, 4ª ed. revista. A ordem. Campinas: UNICAMP/FAPESP. v. I, 2002a.</p>
      <p id="paragraph-ba1d320f605af892094927252fd35dd2"><underline id="underline-2"> _______</underline>. (org.). <bold id="bold-5">Gramática do português falado</bold>, 3ª ed. revista. As abordagens. Campinas: UNICAMP/FAPESP. v. III, 2002a.</p>
      <p id="paragraph-bad0c2d4a7ebb11d9d20c01068ab0d92">CUNHA, C.; LINDLEY-CINTRA, L.F. <bold id="bold-6">Nova gramática do português </bold><bold id="bold-7">contemporâneo</bold>. Rio de Janeiro: Nova Fronteira, 1987.</p>
      <p id="paragraph-21bdfa65cfd57c3869960c0c2984f145">ILARI, R. (Org.). <bold id="bold-8">Gramática do português falado</bold>. 4ª ed. revista. Níveis de análise linguística. Campinas: UNICAMP, v. II, 2002.</p>
      <p id="paragraph-be5026921236df98bc8371df29b696b3">_______<underline id="underline-1944c2ff3fbb4d29e74bc3df22582aa7"> </underline>; BASSO, R. <bold id="bold-31c6c7b1c39c85c1239a2375bbf4cb7e">O português da gente </bold>– a língua que estudamos, a língua que falamos. São Paulo: Contexto, 2006.</p>
      <p id="paragraph-1204ca3be5dd35871a8095f01fb1e518">KATO, M. (Org<bold id="bold-eabeabbaf7ceac23324ac14429ed4fcb">.). Gramática do português falado</bold>. 2ª ed. revista. Convergências. Campinas: UNICAMP, v. V, 2002.</p>
      <p id="paragraph-b6031b59d3e3e4baf8746527ee93dea0">KOCH, I. G. (Org.). <bold id="bold-681ee3e4e3fd120f439a27e4dfc81051">Gramática do português falado</bold>. 2ª ed. revista. Campinas: UNICAMP, v. VI, 2002.</p>
      <p id="paragraph-6add95f466f22eae048afac2656b2dde">MacWHINNEY, B. <bold id="bold-0a886b0383c3f22d4de4691dd87621e8">The CHILDES Project: </bold>Transcription on Format and Programs. 3ª ed. New Jersey: Lawrence Erlbaum, 3ª ed, v. I e II, 2000.</p>
      <p id="paragraph-946d3dbb098917325a813a18fe56a2e9"><underline id="underline-6c7aa548dace28e467e78d887b4a3f60"> _______</underline>. <bold id="bold-64382fe18b4834f2c50323b718f7f32b">Enriching CHILDES for Morphosyntactic Analysis</bold>. Plataforma CHILDES, 2008. Disponível em: &lt;<ext-link id="external-link-1" xlink:href="http://childes.psy.cmu/">http://childes.psy.cmu.</ext-link> edu/morgrams/morphosyntax.doc&gt; Acesso em: 22 set. 2008.</p>
      <p id="paragraph-a33239798c72ed2e7b1da26a9ab82be5">MATTOS E SILVA, R. V. (Org.) <bold id="bold-c887c7aa25a3513cbb9f0b835b039d68">Para a história do português brasileiro</bold>. Primeiros estudos. São Paulo: Humanitas/FAPESP, v. II, 2001.</p>
      <p id="paragraph-91f05a187ac94515a6fdc1dd8d6efe90">MATTOSO CAMARA JR., J. <bold id="bold-b81cf1b8212cbc2dc76f132d696f4a5e">Para o estudo descritivo dos verbos irregulares</bold>. <italic id="italic-954b86a91bbbb0ee4c524c7e51a88317">In</italic>: FALCÃO UCHOA, C. E. (org.). Dispersos de J. Mattoso Câmara Jr<italic id="italic-c4636b68cad9506c6b31ea37c3e41c5b">. </italic>Rio de Janeiro: Lucerna, 2004, p.131-146.</p>
      <p id="paragraph-dc159953cc8f89b3495e5de73e3177a3">MOURA NEVES, M. H. de. (Org.). <bold id="bold-b7c408f2ba95b763daa53c9de4691a4f">Gramática do português falado</bold>. 2ª ed. revista. Novos estudos. Campinas: UNICAMP/Humanitas, v. VII, 1999.</p>
      <p id="paragraph-15"><underline id="underline-3"> _______</underline>. <bold id="bold-9">Gramática de usos do português</bold>. São Paulo: UNESP, 2000.</p>
      <p id="paragraph-17">NARO, A. SCHERRE, M. M. P. <bold id="bold-10">Sobre as origens do português popular do Brasil</bold>. DELTA, v. 9, p. 437-54, 1993.</p>
      <p id="paragraph-19">PRETI, D. (Org.). <bold id="bold-11">Análise de textos orais. São Paulo: </bold>FFLCH/USP, 1993.</p>
      <p id="paragraph-6795b132e1fa0d049ce38c65868a3a61">RONCARATI, C.; ABRAÇADO, J. (Orgs.). <bold id="bold-d3af0bce6e7330bfc6ac2032a468ae21">Português brasileiro: </bold>contato linguístico, heterogeneidade e história. Rio de Janeiro: Letras/ FAPERJ, 2003.</p>
      <p id="paragraph-112e00e8f6e2d8ec25f5344a9924e20e">SCLIAR-CABRAL, L. <bold id="bold-cae3ecc07868fa88934b4dca01c4b0ef">Emergência gradual das categorias verbais no português brasileiro</bold>. ALFA – Revista de Linguística, 51(1), os. p. 222- 234, 2007. Disponível em: <ext-link id="external-link-74ca2d1800bb5fe923e32580f28544f4" xlink:href="http://www.alfa.ibilce.unesp.br/index.php">&lt;http://ww</ext-link>w<ext-link id="external-link-2" xlink:href="http://www.alfa.ibilce.unesp.br/index.php">.alfa.ibilce.unesp.br/index.php&gt;</ext-link></p>
      <p id="paragraph-8279dcb78d9961d2c89d61267bb989b1">VASILÉVSKI, V. <bold id="bold-d18cd4ec234ddcab6508de03796ab7bf">Construção de um sistema computacional para suporte à pesquisa em fonologia do português do Brasil</bold>, Tese (Doutorado) Pós-Graduação em Linguística, Universidade Federal de Santa Catarina, 2008.</p>
      <p id="paragraph-dedf1f18bcbbaef6ef6a20ca60e8fa5e" />
      <p id="paragraph-bb1d529297a743b1f3434a4594cd8626">Créditos:</p>
      <p id="paragraph-c6ec7d2a01e7f4fee8e360c594f2e676">Tradução das glosas para o inglês: Cloves Cardozo (bolsista IC/PIBIC) Programação: Márcio Araújo (Engenharia Eletrônica) e Vera Vasilévski</p>
    </sec>
  </body>
  <back>
    <fn-group>
      <fn id="footnote-6144cf282169a273606793f26bb4b205">
        <label>1</label>
        <p id="paragraph-48809c55e50b47b19e5a1140b48fc308">Para um detalhamento, consulte-se Scliar-Cabral (2007).</p>
      </fn>
    </fn-group>
  </back>
</article>