Proposição das bases para um dicionário on-line de frasemas : diferenciando locuções de colocações sob a perspectiva lexicográfica da teoria sentido-texto
dc.contributor.advisor | Abreu, Sabrina Pereira de | pt_BR |
dc.contributor.author | Carra, Sara Augusto | pt_BR |
dc.date.accessioned | 2025-06-06T06:58:51Z | pt_BR |
dc.date.issued | 2025 | pt_BR |
dc.identifier.uri | http://hdl.handle.net/10183/292687 | pt_BR |
dc.description.abstract | Ao escrever a dissertação de mestrado, erigida a partir dos pressupostos teóricos da Teoria Sentido-Texto (TST), notou-se que os dicionários escolares lematizam colocações como se fossem locuções. Então, surgiu o questionamento: será que os dicionários de língua geral também fazem isso? Assim, nasceu essa tese. Para tanto, um dicionário de bastante credibilidade entre a população comum foi escolhido: o Dicionário Eletrônico Houaiss de Língua Portuguesa (DEHLP). Além de verificar essa questão, a tese se propõe também a averiguar a existência de novas funções lexicais e, até, a partir de casos anômalos, como o sentido do todo ser apenas o sentido de um dos elementos constitutivos e quando parece haver uma fusão entre duas colocações, a existência de um novo tipo de frasema. Fora as questões teóricas, há também uma intenção prática: construir um site, onde estará o dicionário feito sob a ótica da TST – a tese apresenta uma versão demo (um demonstrativo) dele. O corpus inicial foi constituído por 11.702 unidades coletadas manualmente do DEHLP, trata-se das unidades que o dicionário entende como locuções que estão no intervalo A-K. Após a coleta, foram retirados do corpus: 6499 unidades que o próprio dicionário reconhecia como termo da área, 91 clichês linguísticos, 316 unidades que entraram prontas de outras línguas e 131 unidades formadas por termos coordenados. Assim, o corpus para análise contou com 4665 unidades. Dessas unidades, 78,4% corresponde a locuções (sendo que, entre elas, 73% corresponde a locuções fortes, 14,6% a semi-locuções e 12,14% a locuções fracas) e 21,6% a colocações (sendo que, entre elas, 92% corresponde a colocações standards e 8% a colocações não standards) – um dado interessante é que 45% das colocações apresenta uma relação de hiperonímia entre base e colocado. Foram encontradas, aplicadas às colocações standards, 08 funções lexicais (FLs) paradigmáticas e 16 FLs sintagmáticas, além de seis combinações de duas FLs sintagmáticas e duas combinações de uma FL paradigmática e uma FL sintagmática – não foram encontradas combinações de duas FLs paradigmáticas. Sobre os casos anômalos, eles acabaram se mostrando residuais, apenas 28 casos em todo o corpus no total, insuficientes para se fazer qualquer tipo de afirmação. Sobre o caso de novas funções lexicais, verificou-se que se trata, na verdade, de uma relação de hiperonímia entre base e colocado (caso que se mostrou bastante produtivo em nossa língua). A versão demo do dicionário online foi construída a partir da análise. Foram inseridas apenas as locuções fortes e as colocações que estivessem, tanto no DEHLP quanto no site, na letra A: assim, a versão demo conta com 96 locuções e 208 colocações, além de 86 lexemas que são base das colocações. Eles apresentam uma estrutura de nicho léxico; cada verbete conta com sua entrada, sua classe gramatical (no caso das locuções, seu uso), a abonação e, em alguns casos, remissivas (colocadas em hiperlink, que redireciona para a palavra/expressão de mesmo sentido – quando a remissiva se refere a lexema ou a locução, use-se ‘Sinônimo’; quando se refere a colocação, usa-se ‘Mesmo que’). | pt_BR |
dc.description.abstract | When writing the Master's thesis, built on the theoretical assumptions of the Meaning-Text Theory (MTT), it was noted that school dictionaries lemmatize collocations as if they were phrases. Then the following question arose: do general language dictionaries do that too? As a result, this thesis came about. In order to do so, a dictionary that is quite credible among the general population was chosen: the digital version of the Houaiss Dictionary of the Portuguese Language (DEHLP - Dicionário Eletrônico Houaiss de Língua Portuguesa). In addition to assessing this matter, this thesis proposes to investigate the existence of new lexical functions and, based on anomalous cases, when the meaning of the whole can be just the meaning of one of its constituent elements and when there seems to be a fusion between two collocations, the existence of a new type of phraseme. Beyond theoretical matters, there is also a practical side to this: to build a website, which shall host the dictionary created based on the MTT postulates - the thesis present a demo version of the software. Our initial corpus consisted of 11,702 unit manually retrieved from the DEHLP; these are units that the dictionary treats as phrases, located in the A-K range. After retrieval, the following was removed from the corpus: 6,499 units that the dictionary itself treated as technical terms, 91 linguistic clichés, 316 units that were borrowed from other languages unchanged, and 131 units composed of coordinated terms. Thus, the corpus subject to analysis consisted of 4,665 units. Of these units, 78.4% of them correspond to phrases (among them, 73% correspond to strong phrases, 14.6% to semi-phrases and 12.14% to weak phrases), 21.6% to collocations (among them, 92% correspond to standard ones and 8% to non standard ones). An interesting fact about these is that 45% of collocations have a hypernymy relationship between base and collocative partner. Applied to standard collocations, 08 paradigmatic lexical functions (LFs) and 16 syntagmatic LFs were found, in addition to six combinations of two syntagmatic LFs and two combinations of one paradigmatic LF and one syntagmatic LF - no combinations of two paradigmatic LFs were found. With regard to the anomalous cases, they were found to be merely residual, with only 28 cases in the entire corpus in total, being insufficient to make any kind of statement. Regarding the case of new lexical functions, we found that there is in fact a hypernymy relationship between base and collocative partner (a case that has proven to be considerably productive in our language). The online demo version of the dictionary was built based on this analysis. We have only added strong phrases and collocations that were, both in the DEHLP and in the website, under the letter A: thus, the demo version has 96 phrases and 208 collocations, in addition to 86 lexemes that serve as the base of the collocations. They have a lexical niche structure: each headword has its entry, its grammatical category (and use, in the case of phrases), quotations/examples and, in some cases, references (with a hyperlink that redirects users to the word/expression with the same meaning – when the reference refers to a lexeme or phrase, ‘Synonym’ is used; when it refers to a collocation, ‘Same as’ is used). | en |
dc.format.mimetype | application/pdf | pt_BR |
dc.language.iso | por | pt_BR |
dc.rights | Open Access | en |
dc.subject | Phrasemes | en |
dc.subject | Fraseologia | pt_BR |
dc.subject | Phrases | en |
dc.subject | Locuções | pt_BR |
dc.subject | Colocações lexicais | pt_BR |
dc.subject | Collocation | en |
dc.subject | Dicionarios | pt_BR |
dc.subject | Lexical function | en |
dc.subject | Dictionaries | en |
dc.title | Proposição das bases para um dicionário on-line de frasemas : diferenciando locuções de colocações sob a perspectiva lexicográfica da teoria sentido-texto | pt_BR |
dc.type | Tese | pt_BR |
dc.identifier.nrb | 001258459 | pt_BR |
dc.degree.grantor | Universidade Federal do Rio Grande do Sul | pt_BR |
dc.degree.department | Instituto de Letras | pt_BR |
dc.degree.program | Programa de Pós-Graduação em Letras | pt_BR |
dc.degree.local | Porto Alegre, BR-RS | pt_BR |
dc.degree.date | 2025 | pt_BR |
dc.degree.level | doutorado | pt_BR |
Este item está licenciado na Creative Commons License

-
Linguística, Letras e Artes (2982)Letras (1837)