Calificación:
  • 0 voto(s) - 0 Media
  • 1
  • 2
  • 3
  • 4
  • 5
extraer texto de un HTML
#1
Hola a todos tengo un problema y es lo siguiente, quiero extraer el texto principal de una pagina web, por ejemplo una noticia, no extraer el texto de los comentarios, ni de las columnas a los laddos, solo el texto q tiene que ver con la noticia y su imagen asociada, si me pudieran ayudar, yo tengo una funcion que me da el texto entre dos etiquetas diferentes pero lo que pasa es que cuando el texto esta entre varias etqieutas no me lo da completo sino el de la primera etiqueta, ejemplo <p>fsfsdf</p><p>fsfsdfsdsdsd</p>..etc.. me da el primero nada mas, si hubiese alguna manera de cojer el texto de todas las eqtiquetas p, saludos y gracias de antemano
#2
Con PHP podrías hacerlo con la ayuda de file_get_contents() y preg_match() aunque sinceramente no veo porqué querrías obtener tal cosa, a menos que quieras clonar el contenido de una página... como las muchas que hay de taringa (clones de contenido, no del script).
WWW
#3
Con expresiones regulares seria muy engorroso, a lo mejor no me deje explicar bien claro, yo kiero obtener su texto plano pero la parte que me interesa nada mas entienedes, yo obtengo la noticia a traves de un rss y el rss te brinda la posibilidad de obtener la descripcion de la noticia, entonces estaba probando a ver si buscando donde este la descripcion q me devuelva el texto completo, pero solo lo he hecho cuando empiece con ella no cuando este en el medio, ademas como comente ayer, cuando hay varios parrafos seria ineficiente porque entre los parrafos hay saltos de lineas y espacios vacios y enotnces no se que hacer ahi...no tienes ninguna funcion que haga algo parecido..saludos
#4
Si puedes obtener la información desde un XML sería más sencillo.
WWW
#5
me puedes postear un ejemplo si tienes ahi saludos
#6
utiliza simple_html_dom.php a mi esa libreria me saca de muchos apuros ejej saludos
#7
si upsms esa misma es la que estoy usando pero que va todavia no he dado pie con bola con eso lo que mas me he podido acercar es a esto //foreach($html->find('p') as $parrafo){ utf8_decode($parrafo->plaintext);}pero me devuelve todo los parrafos y en algunos sitios el texto no es el uniko que esta entre <p> y otras cosas que esas otras cosas son las q no quiero, estaba pensando en buscar la densidad de las palabras claves y ver entonces la mayro ocurrencia de las mismas pero que va muy engorroso..si sabes algo de como poder hacerlo...gracias de antemano saludos
#8
Y no has intentado quitar el codigo, para que todo quede dentro del primero???Huh




SI TE LLAMA LA ATENCION UNA ESTRELLA... SIGUELA,
SI TE CONDUCE AL PANTANO... YA SALDRAS DE EL.
PERO SI NO LA SIGUES... TODA LA VIDA,
PENSARAS QUE ESA ERA TU ESTRELLA.




WWW
#9
no entiendo bien lo que me quieres decir mispracticas2099, me podrias explicar mejor? muchas gracias por tu respueta
#10
como hago para al seleccionar un texto con el mouse de un parrafo ponerlo en negritas al presionar un boton y despues guardarlo en una variable ese texto para guardarlo en una base de datos..saludos


Posibles temas similares...
Tema Autor Respuestas Vistas Último mensaje
  PRIMER PAGINA WEB HTML DEL MUNDO Smithcanal 18 234 13-08-2017, 08:30 PM
Último mensaje: c42016
  Plantillas HTML Responsive Free Profesionales gassip 16 308 13-06-2017, 03:45 AM
Último mensaje: gassip
Música [Aporte] Reproductor de audio html djsmokingcr 11 259 02-05-2017, 03:04 AM
Último mensaje: gassip
  [Tutorial] Métodos para redireccionar URLs (HTML, PHP y Javascript wiston3 1 126 01-12-2016, 11:12 PM
Último mensaje: zeuz
  Expandir etiquetas HTML en documento .php con EMMET gassip 2 145 18-11-2016, 07:28 PM
Último mensaje: DaveNPlay
  [Aporte] PcTag: Información HTML KesiaMuller 0 127 28-10-2016, 05:42 AM
Último mensaje: KesiaMuller
  [Tutorial] Curso de PSD a HTML a WP habacuc78 14 575 31-08-2016, 09:33 PM
Último mensaje: ServiRemate
  Elementos que desaparecieron de HTML 5 Kevin9908 2 226 02-08-2015, 04:55 PM
Último mensaje: avdarie
  web con html o cms efbsfcd 7 370 01-07-2015, 03:12 PM
Último mensaje: d0rag0n
  Cuanto deberia cobrar por web HTML fercol 15 766 30-06-2015, 06:20 AM
Último mensaje: jhonatan123



Usuarios navegando en este tema: 1 invitado(s)