OK, at the end I did it : I parallelized my highly inefficient #python code with #Joblib https://joblib.readthedocs.io/en/latest/
I discovered you can plug #dask as joblib backend too !!! https://ml.dask.org/joblib.html
This would be amazing, if I only had a cluster to play with....
Depuis plusieurs semaines, la #parallélisation des tâches avec #joblib dans #Python plantait quand le script était compilé. Solution : mettre à la fonction joblib.Parallel() un paramètre explicite prefer="threads" (je ne sais pas pourquoi, je suis sûr que c'est très logique, mais maintenant ça marche et je peux retravailler sur #Bibliostratus)
#parallélisation #joblib #python #Bibliostratus