Quiero convertir algunos textos que incluyen algunos signos de puntuación y símbolos de ancho completo en texto chino puro.Cómo filtrar chino (SOLO chino)
maybe_re = re.compile("xxxxxxxxxxxxxxxxx") #TODO
print "".join(maybe_re.findall("你好,这只是一些中文文本..,.,全角"))
# I want out
你好这只是一些中文文本全角
tks, pero ¿python admite regularmente la categoría Unicode? – Dreampuf
@Dreampuf: expresiones regulares? No tan lejos como sé. Pero puede usar ''' .join (c para c en s si unicodedata.category (c) .startswith ('L'))' –
¡gracias! ¡tienes razón! – Dreampuf