Percepção e produção do contraste da duração de vogais adjacentes a consoantes plosivas finais do inglês (L2) por brasileiros : o papel do treinamento fonético de alta variabilidade (não) associado à instrução explícita de pronúncia a partir de análises de produto e de processo à luz da teoria dos sistemas dinâmicos complexos (TSDC)

Gauer, Luana Tiburi Dani

Visualizar/abrir

Texto completo (11.44Mb)

Data

2024

Autor

Gauer, Luana Tiburi Dani

Orientador

Alves, Ubiratã Kickhöfel

Nível acadêmico

Doutorado

Resumo

Esta Tese de Doutorado apresenta uma discussão, à luz da Teoria dos Sistemas Dinâmicos Complexos, acerca do papel exercido pelo treinamento perceptual de alta variabilidade (associado ou não à explicitação dos itens-alvo), a partir de análises de produto e de processo (Lowie, 2017; Lowie; Verspoor, 2015, 2019; Yu; Lowie, 2019), sobre a percepção e a produção da distinção funcional entre pares mínimos do inglês encerrados por plosivas bilabiais, alveolares e velares – /p/ vs. /b/, /t/ vs. /d/, /k/ vs. /g/ – por aprendizes brasileiros de inglês no contexto da Educação Básica (Ensino Médio). No que diz respeito à oposição de pares de palavras do inglês terminadas em consoantes plosivas surdas e sonoras, a duração da vogal que antecede a consoante final corresponde à pista acústica primordial para a distinção desses pares mínimos, uma vez que, na fala nativa, há um certo grau de dessonorização, que causa inconsistência no vozeamento da consoante final. A vibração das pregas vocais na closura da plosiva, com isso, perde o status de pista prioritária na distinção do contraste surdo-sonoro final dessas consoantes (Ladefoged; Johnson, 2011). Assim sendo, considerando-se o processo de desenvolvimento de uma L2, frisa-se o caráter substancial da investigação sobre o papel da duração vocálica como pista acústica que possa distinguir os membros de pares como “cap” vs. “cab”, “bat” vs. “bad” ou “back” vs. “bag”. Porquanto o status prioritário de pista acústica da duração vocálica deva ser aprendido pelo aprendiz brasileiro de inglês, faz-se mister verificar as possíveis contribuições do treinamento perceptual na ponderação de pistas acústicas (cf. Lehet; Holt, 2017). O papel promissor do treinamento perceptual é orientar aprendizes para os aspectos fonéticos que são observados pelos falantes nativos da língua-alvo; ao se observar o papel do treinamento frente à ponderação de pistas acústicas, mostra-se possível avaliar se os ajustes rápidos nos pesos perceptuais têm consequências concomitantes na produção da fala. O presente trabalho conta com uma metodologia híbrida e é desenvolvido a partir de dois estudos – estudo de produto (transversal) e estudo de processo (longitudinal) –, indo ao encontro da integração dinâmica de métodos de pesquisa à luz da TSDC (Hiver; Al-Hoorie, 2020). No estudo de produto analisaram-se os índices de percepção e de produção de pares mínimos do inglês encerrados por plosivas bilabiais, alveolares e velares, obtidos nas etapas de pré-teste, pós-teste imediato e pós-teste postergado (10 semanas após o término da intervenção), com a finalidade de discutir o papel do treinamento perceptual (associado ou não à explicitação dos itens-alvo). Foram recrutadas três turmas do terceiro ano do Ensino Médio, as quais constituíram, por designação randômica, os Grupos Experimentais 1 e 2 (GE1 e GE2, respectivamente), e o Grupo de Controle (GC), os quais foram submetidos a diferentes condições experimentais (treinamento (GE1), treinamento adicionado de explicitação (GE2) e sem intervenção (GC)). O treinamento perceptual consistiu em cinco sessões de treinamento, uma por dia, ao longo de cinco dias seguidos. A tarefa perceptual de identificação com feedback imediato e cumulativo utilizada para o treinamento contou com 192 tokens dispostos de forma aleatorizada (4 séries (uma por cada locutor) de 48 tokens oriundos de 24 pares mínimos de logatomas no padrão silábico CVC terminados em consoantes plosivas (totalizando 48 types)). Para as sessões de instrução explícita às quais os participantes do GE 2 seriam submetidos antes do início de cada sessão de treinamento, elaborou-se um vídeo de aproximadamente três minutos com a finalidade de demonstrar diferenças na duração vocálica em pares mínimos terminados em consoantes plosivas surdas e sonoras no inglês e a dessonorização de plosivas em final de palavra. No que diz respeito à tarefa de produção, realizada nos três momentos temporais, os aprendizes foram submetidos a uma tarefa de nomeação de imagens (adaptada de Carlet (2017), relativas a 24 itens lexicais em inglês – 12 pares mínimos terminados em /p/, /b/, /t/, /d/, /k/ e /g/. No que se refere à percepção, também realizada nos três momentos temporais, cada grupo de participantes foi submetido, simultaneamente, à realização de uma tarefa perceptual de identificação, sem feedback imediato, de pares mínimos no padrão silábico CVC encerrados por consoantes plosivas (par surdo e sonoro), presentes em frases-veículo, lidas e gravadas por locutores falantes nativos de inglês (homens e mulheres). A tarefa perceptual de identificação continha três partes: (i) composta de 48 tokens (2 séries de 24 types formados por 12 pares mínimos de logatomas gravados por dois locutores (um homem e uma mulher) – destinada à verificação de efeitos na percepção a curto e a longo prazo; (ii) constituída de 24 tokens (2 séries de 12 types formados por 6 pares mínimos de logatomas familiares) – já utilizados na tarefa perceptual de identificação (parte 1) e no treinamento perceptual – gravados por 2 novos locutores (1 homem e 1 mulher) – destinada à generalização a novos locutores; (iii) formada por 24 tokens (2 séries de 12 types oriundos de 6 pares mínimos de itens lexicais do inglês gravados por dois locutores (1 homem e 1 mulher), cujas gravações de logatomas foram utilizadas na tarefa perceptual de identificação (parte 1)) – destinada à generalização a novos itens lexicais. A tarefa de nomeação de imagens e a primeira parte da tarefa perceptual de identificação foram aplicadas nas etapas de pré-teste, pós-teste imediato e pós-teste postergado. A segunda e a terceira parte da tarefa perceptual de identificação, por sua vez, foram aplicadas uma única vez, na etapa de pós-teste imediato. A fim de se verificar se o treinamento perceptual associado (ou não) à instrução explícita de pronúncia exerceu efeitos na percepção (imediatos e de retenção), assim como de generalização à percepção (a novos locutores, a novos itens lexicais) e à produção, os dados de percepção e de produção dos participantes desse estudo foram analisados estaticamente (descritiva e inferencialmente). As análises estatísticas inferenciais foram realizadas por meio de modelos de regressão logística (dados de percepção) e linear (dados de produção) múltipla de efeitos mistos. Como resultados do estudo de produto, no que se refere aos dados de percepção, o treinamento fonético de alta variabilidade associado (ou não) à instrução explícita exerceu efeitos imediatos e a longo prazo sobre a percepção da duração de vogais que antecedem as categorias de consoantes plosivas finais surdas e sonoras. Verifica-se que os conhecimentos adquiridos através do treinamento perceptual conjugado (ou não) à instrução explícita exerceram efeitos de generalização a novos locutores (aos quais os participantes da pesquisa não foram expostos durante o treinamento ou nas etapas de pré-teste ou de pós-testes) e a novos itens lexicais (apenas entre os participantes submetidos ao treinamento perceptual associado à instrução explícita). Com relação aos dados de generalização à produção, verifica-se que o treinamento perceptual associado à instrução explícita exerceu influências de mais curto prazo, de caráter mais imediato, diferentemente do que foi visto entre os participantes submetidos ao treinamento perceptual desassociado da instrução, cujas possíveis influências tiveram um caráter mais progressivo. Menciona-se, ainda, que é nos dados dos participantes submetidos ao treinamento perceptual conjugado à instrução explícita que a distinção entre categorias se mostrou bem mais clara, a partir da duração vocálica: a duração da vogal aumentou antes das plosivas sonoras e diminuiu – ou pelo menos se manteve pouco instável – antes das plosivas surdas. No estudo de processo, a partir da verificação descritiva dos dados de produção longitudinais, acompanhou-se a trajetória desenvolvimental de produção da L2 (inglês), ao longo de três meses, por meio de 12 pontos de coletas de caráter semanal (cf. Yu; Lowie, 2019; Albuquerque, 2019), referente à produção dos pares mínimos que são foco deste trabalho (em uma tarefa de nomeação de imagens – adaptada de Carlet (2017)), de seis aprendizes em nível individual, os quais foram submetidos a diferentes condições experimentais (treinamento (GE1), treinamento adicionado de explicitação (GE2) e sem intervenção (GC)). Cada condição experimental contou com a participação de dois participantes. Foram realizados dois tipos de análises estatísticas: a descritiva – realizada por meio de gráficos de desenvolvimento ao longo de tempo e de gráficos de mínimos e máximos (Van Dijk; Verspoor; Lowie, 2011) – e a inferencial, por meio de Análises de Monte Carlo (Van Dijk; Verspoor; Lowie, 2011), as quais permitem localizar picos significativos de variabilidade nos dados. Essas verificações foram realizadas no aplicativo de criação de planilhas eletrônicas Microsoft Excel, com o auxílio do add-in Pop Tools (Hood, 2009), no caso das Simulações de Monte Carlo, e teve por base o manual de análises dinâmicas de Verspoor, De Bot e Lowie (2011). Nos dados dos participantes submetidos ao treinamento perceptual associado à instrução explícita, evidencia-se mais visivelmente o esforço de dissimilar as categorias surda-sonora a partir da pista prioritária de duração vocálica, uma vez que os participantes promoveram um distanciamento acústico entre duas categorias fonológicas, o qual é maior do que entre os participantes submetidos ao treinamento perceptual desassociado da instrução explícita. Nas análises conduzidas nesse estudo, foi possível observar que, em termos de produção de L2, o treinamento perceptual conjugado à prática de instrução explícita parece ter exercido influência de caráter mais imediato do que a de um trabalho de treinamento perceptual desassociado da instrução, o qual parece ter exercido efeitos de mais longo prazo, de caráter paulatino. Os resultados integrados dos dois estudos, que conjugam as performances do “grupo” e do “indivíduo”, no que diz respeito aos dados de produção, permitem que se verifique que o treinamento perceptual associado à instrução explícita exerceu influências de caráter mais imediato, ao contrário do que foi verificado entre os participantes submetidos ao treinamento perceptual desassociado da instrução –, cujas possíveis influências são mais progressivas. Menciona-se, ainda, que é nos dados dos participantes submetidos ao treinamento perceptual conjugado à instrução explícita que a distinção entre categorias se mostra bem mais clara, a partir da duração vocálica: a duração da vogal aumenta antes das plosivas sonoras e diminui – ou pelo menos se mantêm pouco instável – antes das plosivas surdas. Ressalta-se que o ato de promover um distanciamento acústico entre duas categorias fonológicas a partir da pista prioritária de duração vocálica pode ser visualizado tanto no estudo de produto quanto no estudo de processo, o que denota a propriedade de fractalidade dos Sistemas Dinâmicos Complexos. ...

Abstract

This PhD dissertation is ground on the theoretical approach of Complex Dynamic Systems Theory (CDST). We discuss the role played by High-Variability Perceptual Training (associated or not with explicit instruction). We carried out product and process analyses (Lowie, 2017; Lowie; Verspoor, 2015, 2019; Yu; Lowie, 2019) on the perception and production of the functional distinction between minimal pairs of English ending in bilabial, alveolar and velar stops - /p/ vs. /b/, /t/ vs. /d/, /k/ vs. /g/ - by Brazilian learners of English in Basic Education (High School). Regarding the minimal pairs ending in voiced and voiceless stops, the duration of the vowel that precedes the final consonant corresponds to the primary acoustic cue in distinguishing these consonants, since, in native speech, there is a certain degree of devoicing, which causes inconsistency in the identification of the voicing of this final consonant. The vibration of the vocal folds at the stop closure, therefore, loses its status of a main cue in distinguishing the final voiceless-voiced contrast (Ladefoged; Johnson, 2011). Therefore, considering the L2 developmental process, studies on the role of vowel duration as a primary cue for distinguishing members of pairs such as “cap” vs. “cab”, “bat” vs. “bad” or “back” vs. “bag” assume a pivotal role. As the primary role of vowel duration must be learned by Brazilian learners of English, it is necessary to verify the possible contributions of perceptual training in the weighting of acoustic cues (cf. Lehet; Holt, 2017). The promising role of perceptual training is to guide learners to the phonetic aspects that are observed by native speakers of the target language; by observing the role of training in the weighting of acoustic cues, it should be possible to assess whether rapid adjustments in perceptual weights have concomitant consequences on speech production. This dissertation adopts a hybrid methodology. It consists of two studies – a Product Study (cross-sectional) and a Process Study (longitudinal) –, in favor of a dynamic integration of research methods in CDST (Hiver; Al -Hoorie, 2020). In the Product Study, we analyzed perception and production rates of English CVC minimal pairs ending in bilabial, alveolar and velar stops obtained in a pre-test, an immediate post-test and a delayed post-test (10 weeks after the end of the intervention). This analysis aimed to investigate the role of perceptual training (associated or not with explicit instruction). Three groups from the third year of High School were recruited. These groups constituted, by random assignment, Experimental Groups 1 and 2 (EG1 and EG2, respectively) and the Control Group (CG), which took part in different experimental conditions (training (EG1), training with explicit instruction (EG2) and no training (CG)). The perceptual training sessions consisted of five meetings, one per day, over five consecutive days. The perceptual identification task with immediate and cumulative feedback used for training included 192 tokens presented randomly (4 series (one for each speaker) of 48 tokens from 24 minimal pairs of CVC nonwords ending in plosive consonants (totaling 48 types)). As for the explicit instruction provided to EG2, we showed them a three-minute video highlighting the differences in vowel duration in CVC English words ending in voiceless and voiced stops. In this video, we also showed examples of the devoicing of voiced final stops in English. Regarding the production task, the learners took part in a picture-naming task (adapted from Carlet (2017)). The task consisted of 24 real words in English – 12 minimal pairs ending in /p/, /b/, /t/, /d/, /k/ and /g/ which were elicited and recorded by each participant. Regarding perception, we carried out a perceptual identification task (with no feedback) in the pre and posttests. The stimuli consisted of non-words ending in stop consonants (CVC structure). Each group of participants also took part in a perceptual identification task (with no feedback) of minimal pairs ending in plosive consonants, presented in carrier phrases and recorded by male and female native speakers of English. The perceptual identification task had three parts: (i) the first part of the task consisted of 48 tokens (2 series of 24 types from 12 minimal pairs of non-words recorded by two talkers (a male and a female one)), aiming to verify both short and long-term effects of training on perception; (ii) the second part of the task consisted of 24 tokens (2 series of 12 types from 6 minimal pairs of familiar non-words) – also employed in the perceptual identification task (part 1) and in perceptual training – recorded by 2 new talkers (1 man and 1 woman), aiming to verify the effects of training on the generalization to novel talkers; (iii) the third part of the task consisted of 24 tokens (2 series of 12 types from 6 minimal pairs of real words recorded by two talkers (1 male and 1 female), used in the perceptual identification task (part 1)) aiming to verify the effects of training on the generalization to real words. The picture- naming task and the first part of the perceptual identification task were applied in the pre-test, post-test and delayed post-test. The second and third parts of the perceptual identification task, in turn, were applied only once, in the post-test stage. In order to verify whether perceptual training associated (or not) with explicit pronunciation instruction had effects on perception (post-test and retention test), as well as on the generalization to perception (to novel speakers as well as to real words) and to production, we ran descriptive and inferential analyses. The inferential analyses consisted of logistic (for perception data) and linear (for production data) regression models with mixed effects. As for the results of the Product Study, with regard to perception data, High Variability Phonetic Training associated (or not) with explicit instruction had immediate (but not long-term) effects on the perception of vowel duration. The results suggest that the knowledge acquired through perceptual training combined (or not) with explicit instruction had generalization effects to novel talkers and to English real words (only with EG2 participants). Regarding the data on generalization to production, the perceptual training associated with explicit instruction seemed to show shorter-term effects, differently from what was seen in EG1. The data from EG2 have shown a much clearer distinction in vowel duration: vowels are longer before voiced stops and shorter before voiceless consonants. As for the results of the Process Study, based on the analysis of longitudinal production data, the developmental trajectory of L2 (English) participants was analyzed over three months, through 12 weekly data collection points (cf. Yu; Lowie, 2019; Albuquerque, 2019). The students performed a picture-naming task (adapted from Carlet, 2017). The stimuli consisted of CVC minimal pairs of English real words ending in bilabial, alveolar and velar stops recorded by six learners who had participated in the previous study. Participants were subjected to different experimental conditions (training (EG1), training associated with explicit instruction (EG2) and without intervention (CG)). Two participants from each experimental condition took part in the study. The data were analyzed at an individual level. Two types of statistical analyses were carried out: descriptive – carried out through developmental graphs over time and minimum-maximum graphs (Van Dijk; Verspoor; Lowie, 2011) – and inferential, with Monte Carlo Analyses (Van Dijk; Verspoor; Lowie, 2011), which allowed us to identify significant peaks of variability in the data. The Monte Carlo Simulations were carried out in Microsoft Excel, with Pop Tools add-in (Hood, 2009), and were based on Verspoor, De Bot and Lowie (2011). Participants in EG2 were able to distinguish voiced and voiceless stops in their vowel durations. This distinction was clearer in the EG2 data than in the productions of EG1 participants. n other words, in terms of L2 production, perceptual training combined with explicit instruction seems to have had a more immediate influence than that of perceptual training only, which appears to have had longer-term, gradual effects. The integrated results of the two studies, which combine “group” and “individual” performances with regard to production data, allow us to verify that the perceptual training associated with explicit instruction showed effects of a more immediate nature. I Data from EG1 participants have shown more progressive, less abrupt changes. It is important to reinforce that categorical distinctions are much clearer in EG2: the duration of the vowel increases before voiced stops and decreases - or at least remains a little unstable - before voiceless stops. It is noteworthy that category distinction through vowel duration could be found in both the Product and the Process studies, which denotes the fractality of Complex Dynamic Systems. ...

Instituição

Universidade Federal do Rio Grande do Sul. Instituto de Letras. Programa de Pós-Graduação em Letras.

Coleções

Linguística, Letras e Artes (2892)

Letras (1780)

Outras opções

Mostrar todos os metadados

Estatísticas

Este item está licenciado na Creative Commons License

Visualizar/abrir

Data

Autor

Orientador

Nível acadêmico

Tipo

URI

Outras opções

Assunto

Resumo

Abstract

Instituição

Coleções

Outras opções