Como extrair texto de elementos HTML com classes específicas em matrizes planas usando PHP DOM?

Primeira página > Programação > Como extrair texto de elementos HTML com classes específicas em matrizes planas usando PHP DOM?

Como extrair texto de elementos HTML com classes específicas em matrizes planas usando PHP DOM?

Postado em 2025-02-06

Navegar:626

How to Extract Text from HTML Elements with Specific Classes into Flat Arrays using PHP DOM?

extraindo texto plano de elementos com uma classe designada usando o php dom

extraindo texto de elementos html específicos é uma tarefa comum no desenvolvimento da web. O PHP DOM fornece ferramentas robustas para analisar HTML e acessar seu conteúdo. Este artigo atende a um requisito específico para extrair texto de elementos com uma classe nomeada em duas matrizes planas. Nomes de classe alternados, a tarefa é salvar o texto em duas matrizes: uma para títulos e outra para conteúdo. Por exemplo, dado o seguinte html:

capítulo 1

Este é o capítulo 1

precisamos obter a seguinte saída:

$ heading = ['Capítulo 1', 'Capítulo 2', 'Capítulo 3']; $ content = ['Este é o capítulo 1', 'este é o capítulo 2', 'este é o capítulo 3'];

Chapter 1

This is chapter 1

solução

$heading = ['Chapter 1', 'Chapter 2', 'Chapter 3'];
$content = ['This is chapter 1', 'This is chapter 2', 'This is chapter 3'];

carrega o html em um objeto domdocument:

$ dom = new DomDocument (); $ dom-> loadHtml ($ test);

Crie um objeto domxpath para executar xpaths:

$dom = new DOMDocument();
$dom->loadHTML($test);

use a função parsetoarray () para extrair texto de elementos com classe especificada:

$xpath = new DOMXPath($dom);

executa uma consulta XPath para a classe designada.

Chapter 1

This is chapter 1

itera através dos nós correspondentes e extrai seu conteúdo de texto.

Php função parsetoarray (domxpath $ xpath, string $ classe): Array { $ xpathQuery = "//*[@class = '$ class']"; $ elements = $ xpath-> consulta ($ xpathquery); $ resultArray = []; foreach ($ elements como $ element) { $ nós = $ element-> ChildNodes; foreach ($ nós como $ node) { $ resultArray [] = $ node-> nodEvalue; } } return $ resultArray; } $ test = capítulo 1

Este é o capítulo 1

capítulo 2

Este é o capítulo 2

capítulo 3

Este é o capítulo 3

Html; $ dom = new DomDocument (); $ dom-> loadHtml ($ test); $ xpath = new DomXPath ($ dom); $ Heading = Parsetoarray ($ XPath, 'Heading1-H'); $ content = parsetoarray ($ xpath, 'normal-h'); var_dump ($ cabeçalho); eco "
"; var_dump ($ content); eco "
";

Tutorial mais recente Mais>

Objetos-ajuste: a capa falha no IE e na borda, como consertar?
object-fit: a capa falha no ie e borda, como corrigir? utilizando objeto-fit: cover; No CSS, para manter a altura consistente da imagem funcio...

Programação Postado em 2025-04-08
Como exibir corretamente a data e a hora atuais em formato "dd/mm/yyyy hh: mm: ss.ss" em java?
como exibir a data e a hora atuais em "dd/mm/yyyy hh: mm: ss.ss" formato no código java fornecido, o problema com a exibição da data...

Programação Postado em 2025-04-08
Como posso substituir com eficiência várias substringas em uma string java?
substituindo várias substâncias em uma string com eficiência em java quando confrontado com a necessidade de substituir várias substringas den...

Programação Postado em 2025-04-08
Por que estou recebendo um erro "não consegui encontrar uma implementação do padrão de consulta" na minha consulta Silverlight Linq?
ausência de implementação do padrão de consulta: resolvendo "não conseguiu encontrar" erros em um aplicativo Silverlight, uma tentat...

Programação Postado em 2025-04-08
Como converter uma coluna Pandas Dataframe em formato e filtrar por data de tempo por data?
transformar a coluna Pandas Dataframe em DateTime Format cenário: Dados em um dataframe de pandas frequentemente existe em vários formatos, ...

Programação Postado em 2025-04-08
Como posso personalizar otimizações de compilação no compilador Go?
personalizando otimizações de compilação no Go Compiler O processo de compilação padrão em Go segue uma estratégia de otimização específica. N...

Programação Postado em 2025-04-08
Como combinar dados de três tabelas MySQL em uma nova tabela?
mysql: Criando uma nova tabela a partir de dados e colunas de três tabelas pergunta: como eu posso criar uma tabela que a tabela se selecio...

Programação Postado em 2025-04-08
Como remover os manipuladores anônimos de eventos JavaScript de maneira limpa?
removendo os ouvintes anônimos do evento adicionando ouvintes de eventos anônimos a elementos fornece flexibilidade e simplicidade, mas quando é...

Programação Postado em 2025-04-08
Qual método é mais eficiente para a detecção de ponto em polígono: rastreamento de raio ou path.contains_points?
detecção de ponto-em-polígono eficiente em python determinar se um ponto está dentro de um polígono é uma tarefa frequente na geometria computac...

Programação Postado em 2025-04-08
Por que o Firefox exibe imagens usando a propriedade CSS `Content`?
exibindo imagens com URL de conteúdo em Firefox Um problema foi encontrado onde certos navegadores, especificamente Firefox, falham em exibir ...

Programação Postado em 2025-04-08
Como verificar se um objeto tem um atributo específico no Python?
Método para determinar o atributo de objeto Existence Esta consulta busca um método para verificar a presença de um atributo específico em um ...

Programação Postado em 2025-04-08
Como recuperar com eficiência a última linha para cada identificador exclusivo no PostGresql?
postGresql: Extraindo a última linha para cada identificador exclusivo em postgresql, você pode encontrar situações em que você precisa extrai...

Programação Postado em 2025-04-08
Como remover emojis das cordas em Python: um guia para iniciantes para corrigir erros comuns?
removendo os emojis de strings em python o código Python fornecido para remover emojis falha porque contém syntaxe erros. As cadeias de unicod...

Programação Postado em 2025-04-08
Por que não está aparecendo na minha imagem de fundo do CSS?
SOLHAÇÃO DE TRABALHO: CSS Imagem de fundo não apareceu Você encontrou um problema em que sua imagem em segundo plano falha, apesar das seguint...

Programação Postado em 2025-04-08
Como posso concatenar com segurança o texto e os valores ao construir consultas SQL em Go?
concatenando texto e valores em go sql Queries Ao construir uma consulta SQL texth e, em codificação, e a signa e a consulta de syntax e a sín...

Programação Postado em 2025-04-08

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo