Clique Aqui Extraindo uma base de dados de um search engine - Página 3

Lista de Usuários Marcados

Página 3 de 5 PrimeiroPrimeiro 12345 ÚltimoÚltimo
Resultados 21 a 30 de 47
Like Tree12Likes

Tópico: Extraindo uma base de dados de um search engine

  1. #21
    Expert Avatar de SketchDraft
    Data de Ingresso
    10/01/10
    Localização
    Sydney, Straya
    Posts
    3.206
    mas você tem os dados mas eles não estão tratados né ?
    tipo o formato de saída não é página html ?
    Última edição por SketchDraft; 11-10-2013 às 18:18.
    Registre-se ou faça login para ver assinaturas.

  2. #22
    Administrador Avatar de Alvinho
    Data de Ingresso
    08/09/07
    Posts
    48.548
    você pode escolher o formato de saída. normalmente vai ser csv ou algo do tipo.
    Registre-se ou faça login para ver assinaturas.

  3. #23
    World Class Avatar de rocksfeller
    Data de Ingresso
    23/10/09
    Localização
    Universo Paralello
    Posts
    5.055
    Citação Postado originalmente por SketchDraft Ver Post
    mas você tem os dados mas eles não estão tratados né ?
    tipo o formato de saída não é página html ?
    no caso dessas ferramentas prontas aí não sei como funciona... no caso de vc desenvolver um robo pra isso, quando vc ler dado X, vc insere ele na sua tabela, quando vc ler dado Y, vc insere ele de novo na sua base e assim por diante...
    SketchDraft likes this.
    Registre-se ou faça login para ver assinaturas.

  4. #24
    Administrador Avatar de Alvinho
    Data de Ingresso
    08/09/07
    Posts
    48.548
    web scraping significa exatamente tirar pegar o html das páginas e transformar em dados estruturados.
    Registre-se ou faça login para ver assinaturas.

  5. #25
    Expert Avatar de SketchDraft
    Data de Ingresso
    10/01/10
    Localização
    Sydney, Straya
    Posts
    3.206
    IMHO eu acho que vocês tão simplificando a parada.
    Não sei se é porque tô com sono, mas eu to vendo mais coisa ai onde vocês estão enxergando simplicidade.

    Eu vou pedir q o @ekalil, clique em qualquer result e poste a página em HTML aqui só pra me darem uma luz.
    Registre-se ou faça login para ver assinaturas.

  6. #26
    Expert Avatar de RKint
    Data de Ingresso
    16/09/11
    Posts
    2.972
    Images
    66
    @ekalil, basicamente o que eu fiz aqui no MaisEV foi a mesma coisa... li um monte de páginas HTML e tratei elas. Se tiver todas essas infos disponíveis de modo regular (por ex, se a página não for algo do tipo exemplo.com / A6788GhlL09?q312Rty), dá pra fazer sim.

    E daí pra armazenar no BD é rapidinho.

    edit

    Pra ver a viabilidade, dá um search em todas as entradas e mostra o link da primeira e da segunda página.
    Registre-se ou faça login para ver assinaturas.

  7. #27
    Administrador Avatar de Alvinho
    Data de Ingresso
    08/09/07
    Posts
    48.548
    da pra fazer de qualquer jeito, um scraper consegue "navegar" a página numa boa, "clicando" em cada resultado da busca
    Registre-se ou faça login para ver assinaturas.

  8. #28
    Expert Avatar de RKint
    Data de Ingresso
    16/09/11
    Posts
    2.972
    Images
    66
    Sim, dá. To falando do jeito que usei aqui no MaisEV mesmo, que tem um padrão bem regular pras URLs.
    Registre-se ou faça login para ver assinaturas.

  9. #29
    World Class Avatar de ekalil
    Data de Ingresso
    24/02/08
    Localização
    São Paulo
    Posts
    27.226
    Citação Postado originalmente por RKint Ver Post
    Sim, dá. To falando do jeito que usei aqui no MaisEV mesmo, que tem um padrão bem regular pras URLs.
    Se vc estiver com tempo e boa vontade, me add no Skype pra me dar uma dicas de como fazer, please.

    Registre-se ou faça login para ver assinaturas.

  10. #30
    Administrador Avatar de Alvinho
    Data de Ingresso
    08/09/07
    Posts
    48.548
    ekalil, posta ae o html plz. abre um contato, clica com o botão direito, exibir código fonte, e cola aqui
    Registre-se ou faça login para ver assinaturas.

Permissões de postagem

  • Você não pode iniciar novos tópicos
  • Você não pode enviar respostas
  • Você não pode enviar anexos
  • Você não pode editar suas mensagens
  •  
© 2007-2019 · MaisEV · Todos os direitos reservados