Humanização da Inteligência Artificial: análise qualitativa exploratória através do software Iramuteq

Humanização da Inteligência Artificial: análise qualitativa exploratória através do software Iramuteq

Adriana Santos, Instituto Federal da Bahia (Brasil)

Professora no Instituto Federal da Bahia (IFBA), Brasil e Doutoranda IFBA/UFBA/UNEB com estágio na Universidade de Aveiro (Portugal).

QNOW Autor António Pedro Costa

António Pedro Costa, Universidade de Aveiro (Portugal)

Investigador do Centro de Investigação em Didática e Tecnologia na Formação de Formadores (CIDTFF), Departamento de Educação e de Psicologia, da Universidade de Aveiro e colaborador do Laboratório de Inteligência Artificial e Ciência de Computadores (LIACC), da Faculdade de Engenharia da Universidade do Porto.

A humanização da Inteligência Artificial (IA) é um tema emergente que necessita de ser aprofundado. Para explorar este tópico, foi realizada uma análise qualitativa exploratória de um corpus textual com 266 publicações recorrendo ao software Iramuteq. O IRaMuTeQ (Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires) é um software livre desenvolvido por Pierre Ratinaud em 2009, no âmbito do Laboratoire d’Études et de Recherches Appliquées en Sciences Sociales (LERASS) da Universidade de Toulouse.  O foco deste texto é, essencialmente, descrever o passo-a-passo do processo analítico sobre o tópico mencionado através de um software de leciometria, como é o caso do Iramuteq.

Passo 1 - Coleta de artigos científicos

Os metadados de artigos científicos foram coletados das bases Scopus e Web of Science, no formato “.bib”. É conveniente  que o corpus lido pelo Iramuteq tenha um “volume” significativo de texto (taxa de retenção no software igual ou maior do que 75%). Para converter os metadados (neste caso específico os resumos) para o formato “.txt” recorreu-se ao ChatGPT, conforme ilustrado na Fig. 1.

Figura 1 Modelo de prompt usado no ChatGPT para extração de resumos dos metadados
Fig. 1 - Modelo de prompt usado no ChatGPT para extração de resumos dos metadados

Passo 2 - Preparação do Corpus Textual

Os resumos dos artigos científicos foram organizados num arquivo (.txt) compatível com o Iramuteq.

  • Cada texto foi estruturado de forma padronizada, evitando caracteres especiais e organizando os segmentos de texto com marcações apropriadas, como:

**** *Artigo1_Título

Escreva aqui o texto do resumo.

 

O corpus textual é a junção de todos os textos. Os textos são identificados pelo software através de uma linha de comando que utiliza **** (quatro asteriscos) e devem ser identificados conforme orientações na Fig. 2. O software divide os textos em segmentos de texto (ST) para realizar as análises. Exemplo de um corpus textual (Fig. 2) que deverá estar salvo no computador em formato .txt com a codificação (UTF-8).

Figura 2 Corpus textual dos artigos científicos coletados a respeito do tema Humanização da IA
Fig. 2 - Corpus textual dos artigos científicos coletados a respeito do tema Humanização da IA

A acentuação e caracteres especiais são retirados das palavras que compõem os textos analisados.

Passo 3 – Resultados das análises com Iramuteq

3.1 Análise lexicográfica

Na análise lexicográfica clássica são identificadas as formas ativas (palavras), denominadas assim conforme a frequência em que aparecem no corpus textual. O programa identifica e reformata unidades de texto, transformando Unidades de Contexto Iniciais (UCI) em Unidades de Contexto Elementares (UCE).

É representada graficamente pela nuvem de palavras (Fig. 3), na qual quanto maior a frequência maior é o tamanho da fonte das palavras, indicando maior ou menor ocorrência do interior da nuvem para as extremidades.

Figura 3 Nuvem de palavras do corpus textual analisado
Fig. 3 - Nuvem de palavras do corpus textual analisado

Tabela 1 – Análise Lexicográfica: formas ativas geradas no software Iramuteq

Formas Ativas
Frequência
1.
artificial_intelligence
2.791
2.
human
1.572
3.
study
504
4.
learn
382

A partir do levantamento dos resumos dos artigos, que visou trabalhos relacionados com a humanização da IA, percebeu-se que os termos que apareceram com maior frequência (Tabela 1) foram: “inteligência artificial” (f = 2.791), “humano” (f = 1.572), “estudo” (f = 504), “aprender” (f = 382), “confiança” (f = 234), “percepção” (f = 100), “ética” (f = 93), “professor” (f = 93). A relação entre os termos “IA e humano” sugere que a pesquisa sobre IA é frequentemente analisada sob a ótica de como ela interage, impacta ou se integra com as experiências humanas.

Este vínculo destaca o foco em uma IA mais empática, colaborativa e adaptada às necessidades humanas. A alta frequência da palavra “estudo” indica um foco em pesquisas empíricas sobre IA. Já a “percepção” sugere que muitos trabalhos avaliam como os humanos entendem, avaliam ou experimentam interações com sistemas de IA reforçando a necessidade de abordagens qualitativas e quantitativas. Os termos “ética e confiança” estão fortemente relacionados, porque a confiança em sistemas de IA depende de princípios éticos sólidos, como transparência, explicabilidade e imparcialidade.

Isso reflete a preocupação em garantir que as interações com IA sejam justas e compreensíveis. Os termos “professor” e “aprendizagem” sugerem um foco em aplicações educacionais da IA, onde ela é usada para personalizar a aprendizagem ou para apoiar professores em contextos pedagógicos. Essa conexão reforça a ideia de IA como uma ferramenta que complementa o processo educativo. A frequência da palavra “ética” no contexto da humanização da IA demonstra a preocupação com os impactos sociais, culturais e morais da tecnologia. Ela reflete a necessidade de alinhar o desenvolvimento da IA com valores humanos universais.

3.2 Análise de similitude

A análise de similitude realizada pelo Iramuteq está fundamentada na teoria dos grafos, que identifica e representa a ligação ou a conexão que existe entre as formas ativas do corpus textual. Esta análise permite olhar para a estrutura de construção dos textos e dos temas dos quais as pesquisas trataram, possibilitando perceber quais formas ativas mais se aproximam ou se afastam, ou seja, identificar a maior ou menor conexidade entre elas. Quanto mais espessa a linha de ligação entre as formas ativas maior será a conexão entre elas. Conforme a Fig. 4, as palavras “inteligência artificial” e “humano” estão fortemente interligadas e isso é representado pela ligação espessa.

Figura 4 Árvore máxima de similitude do corpus textual analisado
Fig. 4 – Árvore máxima de similitude do corpus textual analisado
3.3 Análise de Classificação Hierárquica Descendente

O Método da Classificação Hierárquica Descendente (CHD) revela as correlações das palavras em grupos denominadas classes, as quais são representadas através de um dendrograma. O dendrograma consiste num agrupamento que o Iramuteq realiza das formas ativas, conforme a correlação entre elas, formando um esquema hierárquico de classes de vocabulários. Esta análise dá-se a partir do teste estatístico de associação qui-quadrado[1]. Cada partição do dendrograma representa uma classe de agrupamento de palavras que apresentam uma forte associação entre si. O dendrograma da Fig. 5 é formado pelas três (3) classes geradas pelo Método da Classificação Hierárquica Descendente.

[1]  O teste de associação qui-quadrado (χ²) é um teste de hipóteses que se destina a encontrar um valor da dispersão para duas variáveis categóricas nominais e avaliar a associação existente entre variáveis qualitativas. É um dos testes estatísticos mais utilizados em pesquisa social.

Fig. 5 - Dendrograma de Classes gerado pelo Método da Classificação Hierárquica Descendente (CHD)

As três classes que foram geradas contêm as formas ativas representadas também em letras de diferenciados tamanhos, sendo decrescentemente correspondentes aos valores do teste de associação qui-quadrado, gerado nos relatórios do Iramuteq, ou seja, conforme sua maior aderência na própria classe e entre as classes. Cada classe gerada revela aspectos do corpus textual que possibilitam a combinação de análises quantitativas e qualitativas.

4. Considerações Finais

Não sendo o objetivo deste texto uma análise aprofundada sobre a humanização da IA, mas a exploração do software Iramuteq no apoio à tomada de decisão, poder-se-ia depender de princípios como ética, confiança e percepção humana, que aparecem como temas centrais nos resumos dos artigos analisados.

Ensino e Aprendizado Assistidos por IA

O corpus revelou uma forte presença de temas relacionados com o uso de IA em contextos educacionais, como personalização da aprendizagem e suporte pedagógico. A humanização, neste caso, refere-se à capacidade da IA ​​de atuar como um assistente “humano” no processo educativo.

Confiança e Explicabilidade

Se um sistema de IA é usado para classificar estudantes em categorias de desempenho, um sistema explicável indica os critérios usados ​​(por exemplo, notas, participação, frequência) e mostra como esses fatores influenciaram a classificação. Isto poderia permitir que os professores questionassem ou validassem as decisões, promovendo transparência e confiança.

 

A explicabilidade da IA ​​é essencial para promover a confiança dos usuários, no seu uso. O corpus destacou a necessidade de sistemas transparentes, que oferecem justificativas claras para as suas decisões.

Impactos Sociais e Futuro da IA

A análise evidenciou preocupações com os impactos sociais, culturais e éticos da IA. Alguns estudos parecem apontar para a necessidade de alinhar a tecnologia às necessidades humanas, garantindo que o progresso seja inclusivo e ético.

Abordagem Interdisciplinar

A humanização da IA ​​envolve aspectos tecnológicos, educacionais, éticos e sociais. Isto reforça a importância de pesquisas que integrem diferentes áreas do conhecimento. O Iramuteq permite a identificação de padrões e categorias importantes no corpus. Esta análise preliminar/exploratória destacou a complexidade da humanização da IA indo além de sua funcionalidade técnica e abordando questões como confiança, impacto social e adaptação às necessidades humanas. Este processo de análise pode ser replicado em estudos académicos e nas suas próprias pesquisas, oferecendo uma visão clara e estruturada sobre temas complexos relacionados.

Bibliografia

Andrade, L. R., Brandão, C., & Costa, A. P. (2022). A vida visual dos dados qualitativos – PARTE 2. Blog QNOW. https://ludomedia.org/a-vida-visual-dos-dados-qualitativos-parte-2/

 

Camargo, B. V., & Justo, A. M. (2013). IRAMUTEQ: um software gratuito para análise de dados textuais. Temas em Psicologia21(2), 513-518.

 

De Souza, M., Wall, M., De Morais Chaves Thuler, A., Lowen, I., & Peres, A. (2018). The use of IRAMUTEQ software for data analysis in qualitative research.. Revista da Escola de Enfermagem da U S P, 52, e03353 . https://doi.org/10.1590/S1980-220X2017015003353.

 

Ratinaud, P. (2009). IRaMuTeQ: Interface de R pour les Analyses Multidimensionnelles de Textes et de Questionnaires [Software] (0.8 alpha 7 (02/11/2024)). http://www.iramuteq.org/

 

Valderez Marina do Rosário Lima, Marcelo Prado Amaral-Rosa, & Maurivan Güntzel Ramos. (2021). Software-supported Discursive Textual Analysis: IRaMuTeQ and subcorpus analysis. New Trends in Qualitative Research7, 1–9. https://doi.org/10.36367/ntqr.7.2021.1-9.

Publicações relacionadas

Share

Notícias Relacionadas

A metodologia de narrativa de história com dados apresentada destaca a importância de se unir análise de dados e técnicas narrativas de forma estratégica…
Narrativa de histórias com dados (Data storytelling) é uma prática emergente que combina visualização de dados, técnicas narrativas e elementos interativos…
A relação entre a solicitação da Chain of Thought (CoT) e a ferramenta STORM está enraizada no seu objetivo comum de melhorar as capacidades…