Удалить текст: u из строк в python
Я использую библиотеку xlrd для импорта значений из файла excel в список python. У меня есть один столбец в файле excel и извлечение строки данных. Но проблема в том, что данные, которые я получаю в списке,
list = ["text:u'__string__'","text:u'__string__'",.....so on]
Как я могу удалить этот текст: u из этого, чтобы получить естественный список со строками?
код здесь, используя python2.7
book = open_workbook("blabla.xlsx") sheet = book.sheet_by_index(0) documents = [] for row in range(1, 50): #start from 1, to leave out row 0 documents.append(sheet.cell(row, 0)) #extract from first col data = [str(r) for r in documents] print data
Итерации по элементам и удаление дополнительных символов из каждого слова:
s=[] for x in list: s.append(x[7:-1]) # Slice from index 7 till lastindex - 1
Если это стандартный список входных данных, вы можете сделать это с помощью простого split
[s.split("'")[1] for s in list] # if your string itself has got "'" in between, using regex is always safe import re [re.findall(r"u'(.*)'", s)[0] for s in list] #Output #['__string__', '__string__']