2012-10-04 10 views
14

Estoy usando sklearn.pipeline.Pipeline para encadenar extractores de funciones y un clasificador. ¿Hay alguna manera de combinar varias clases de selección de características (por ejemplo, las de sklearn.feature_selection.text) en paralelo y unir sus resultados?Combinación de clases de extracción de características en scikit-learn

Mi código en este momento se ve de la siguiente manera:

pipeline = Pipeline([ 
    ('vect', CountVectorizer()), 
    ('tfidf', TfidfTransformer()), 
    ('clf', SGDClassifier())]) 

El resultado es el siguiente:

vect -> tfidf -> clf 

Quiero ser capaz de especificar una tubería que se ve de la siguiente manera:

vect1 -> tfidf1 \ 
       -> clf 
vect2 -> tfidf2/

Respuesta

16

Esto se ha implementado recientemente en la rama principal de scikit-learn bajo el nombre FeatureUnion:

http://scikit-learn.org/dev/modules/pipeline.html#feature-union

+2

Sí, lo vi en http://blog.kaggle.com/2012/09/26/impermium-andreas-blog/ después hice la pregunta –

+0

fresca, un primer usuario:) ¡Avíseme si lo encuentra útil! –

+1

'sklearn.pipeline.FeatureUnion' está en la versión 0.13.1 – smci

Cuestiones relacionadas