La respuesta de Ben es correcta acerca de todos los puntos, pero me gustaría añadir mis consideraciones.
Acerca del reconocimiento de imágenes: le resultará bastante fácil, dado un gran conjunto de imágenes, identificar objetos como pechos desnudos, penes y otros dentro de ellos mediante el reconocimiento de patrones.
Todos los algoritmos de inteligencia artificial, sin embargo, tienen puntos débiles. Es posible que experimente que un determinado porcentaje de sus imágenes, según la calidad del clasificador utilizado, está mal clasificado.
Luego, tiene que aplicar otros criterios más que el procesamiento de imágenes. Seguramente los criterios de Google no son públicos, pero le gustaría considerar las etiquetas ICRA para marcar de forma voluntaria cierto material como material adulto, procesamiento de texto y enlaces entre dominios. Si yo fuera el creador de Safesearch, habría adoptado el siguiente patrón: los sitios para adultos a menudo intercambian enlaces, por lo que encontrarás muchas intersecciones en los gráficos de enlaces entre un grupo de sitios para adultos.
Poniendo todo junto, un buen enfoque de clasificación utiliza varios pequeños criterios, anotando ellos para determinar si una imagen es una imagen adulta o no.
¿Quién vota cerrar este por ser demasiado localizado? ¿Cómo está demasiado localizado? – marcog
Si el idioma no importa, ¿por qué etiquetó esto con dos etiquetas de idioma? – sbi
@sbi: * tal vez * estos son sus idiomas favoritos. Los volvería a tachar, pero prefiero esperar su acción;) –