Yagami Shizui

Membros

Perfil Explorar Conteúdo

Total de itens
4
Registro em
Agosto 23, 2017
Última visita
Agosto 24, 2017

Sobre Yagami Shizui

Yagami Shizui's Achievements

Reputação

Raspagem de dados

uma questão postou Yagami Shizui Python

Bom dia. Estou com dificuldade na raspagem de dados utilizando a biblioteca BeautifulSoup, onde a ausencia de dados dentro das <td> não é coletada. Eu gostaria de saber se existe algum parametro que devo especificar durante a busca find_all() ou se devo fazer um len() no conteudo pego pelo meu for lendo o tamanho do conteudo coletado na tabela e depois guardando em alguma lista #!/usr/bin/python3 import pandas as pd from bs4 import BeautifulSoup import requests import pandas as pd gid = [] cidade = [] lista = pd.read_csv('/home/fabio/Downloads/Nova_lista.csv') for i in lista['gid']: gid.append(i) for p in lista['nome']: cidade.append(p) link = ('http://iridl.ldeo.columbia.edu/SOURCES/SOURCES/.USGS/.LandDAAC/.MODIS/.1km/.8day/.version_005/.Terra/.NSA/.Day/.LST/T/(Jan%202001)/(Mar%202015)/RANGE/X/-82/-34/RANGEEDGES/Y/-38.0/12.0/RANGEEDGES/T/monthlyAverage/home/.jdcorral/.Brazil/.mun_2016_03_21/.the_geom/gid/GID/VALUE/%5BX/Y%5Dweighted-average/T+exch+table-+text+text+skipanyNaN+-table+.html') with open('df_temp_day.csv' , 'a') as f: for i in lista['gid']: page = requests.get(link.replace('GID','%s'%i)) soup = BeautifulSoup(page.text,'lxml') tabela = soup.find_all('table',text=False) for td in tabela: linha = td.find_all('td') k = 0 p = 1 while k <= len(linha) and p <= len(linha): mes = str(linha[k].get_text()) variavel = str(linha[p].get_text()) k +=2 p +=2 n = gid.index(i) f.writelines('"%s", %s, "%s" ,"gid %s"\n' %(mes,variavel,cidade[n],i)) print('"%s", %s, %s %s' %(mes,variavel,cidade[n],i)) Obs : Neste codigo eu já estou testando o parametro text=False, mas não sei realmente o que faz
- Agosto 23, 2017
- - web
  - scrapping
  - (e %d mais)
    Tags:
    
    web
    
    scrapping
    
    raspagem
    
    dados
    
    python3
    
    beautifulsoup
    
    internet
    
    python
Raspagem de dados

uma questão postou Yagami Shizui Python

Bom dia. Estou com dificuldade na raspagem de dados utilizando a biblioteca BeautifulSoup, onde a ausencia de dados dentro das <td> não é coletada. Eu gostaria de saber se existe algum parametro que devo especificar durante a busca find_all() ou se devo fazer um len() no conteudo pego pelo meu for lendo o tamanho do conteudo coletado na tabela e depois guardando em alguma lista #!/usr/bin/python3 import pandas as pd from bs4 import BeautifulSoup import requests import pandas as pd gid = [] cidade = [] lista = pd.read_csv('/home/fabio/Downloads/Nova_lista.csv') for i in lista['gid']: gid.append(i) for p in lista['nome']: cidade.append(p) link = ('http://iridl.ldeo.columbia.edu/SOURCES/SOURCES/.USGS/.LandDAAC/.MODIS/.1km/.8day/.version_005/.Terra/.NSA/.Day/.LST/T/(Jan%202001)/(Mar%202015)/RANGE/X/-82/-34/RANGEEDGES/Y/-38.0/12.0/RANGEEDGES/T/monthlyAverage/home/.jdcorral/.Brazil/.mun_2016_03_21/.the_geom/gid/GID/VALUE/%5BX/Y%5Dweighted-average/T+exch+table-+text+text+skipanyNaN+-table+.html') with open('df_temp_day.csv' , 'a') as f: for i in lista['gid']: page = requests.get(link.replace('GID','%s'%i)) soup = BeautifulSoup(page.text,'lxml') tabela = soup.find_all('table',text=False) for td in tabela: linha = td.find_all('td') k = 0 p = 1 while k <= len(linha) and p <= len(linha): mes = str(linha[k].get_text()) variavel = str(linha[p].get_text()) k +=2 p +=2 n = gid.index(i) f.writelines('"%s", %s, "%s" ,"gid %s"\n' %(mes,variavel,cidade[n],i)) print('"%s", %s, %s %s' %(mes,variavel,cidade[n],i)) Obs : Neste codigo eu já estou testando o parametro text=False, mas não sei realmente o que faz
- Agosto 23, 2017
- - web
  - scrapping
  - (e %d mais)
    Tags:
    
    web
    
    scrapping
    
    raspagem
    
    dados
    
    python3
    
    beautifulsoup
    
    internet
    
    python
Pergunta noob sobre (iniciante noob) Python

pergunta respondeu ao Gustavo Neri de Yagami Shizui em Python

Seu input ta vazio, ele vai travar logo na primeira faça algo como : nome = input('nome: ') salfixo = float(input('salfixo: ')) vendas = float(input('vendas: ')) total = float(salfixo +(15*vendas)/100) print ('%5.2f' %total) .................................................................... Pow, desculpa a postagem atrasada haha foi sem ver que tu já tinha resolvido
Copiar texto web com python

pergunta respondeu ao Marques Leão de Yagami Shizui em Python

Você se refere a raspagem de dados? Estou com dificuldade em algo parecido. Infelizmente usando BeautifulSoup, não estou conseguindo baixar os dados ausentes dentro de algumas td
- Agosto 23, 2017
- 1 resposta

Entrar

Yagami Shizui

Total de itens

Registro em

Última visita

Sobre Yagami Shizui

Yagami Shizui's Achievements

Reputação

Raspagem de dados

Raspagem de dados

Pergunta noob sobre (iniciante noob) Python

Copiar texto web com python

Navegação

Atividades