Piège de performance : bibliothèques générales et objets d'assistance

Page de garde > La programmation > Piège de performance : bibliothèques générales et objets d'assistance

Piège de performance : bibliothèques générales et objets d'assistance

Publié le 2024-11-02

Parcourir:841

La commodité et les performances sont généralement inversement corrélées. Si le code est simple à utiliser, il est moins optimisé. Si c’est optimisé, c’est moins pratique. Un code efficace doit se rapprocher des moindres détails de ce qui est réellement exécuté, comment.

Je suis tombé sur un exemple dans notre travail en cours visant à exécuter et optimiser la segmentation cellulaire DeepCell pour la recherche sur le cancer. Le modèle DeepCell AI prédit quels pixels sont les plus susceptibles de se trouver dans une cellule. À partir de là, nous "inondons" les pixels les plus probables, jusqu'à atteindre la bordure de la cellule (en dessous d'un certain seuil).

Une partie de ce processus consiste à combler de petites lacunes à l'intérieur des cellules prédites, ce qui peut se produire pour diverses raisons mais n'est pas biologiquement possible. (Pensez aux trous de beignet, pas à la membrane poreuse d'une cellule.)

L'algorithme de remplissage des trous ressemble à ceci :

Identifiez les objets (pixels contigus avec une étiquette de cellule donnée avec le même identifiant numérique).
Calculez le "nombre d'Euler" de ces cellules, une mesure de la surface de la forme.
Si le nombre d'Euler est inférieur à 1 (c'est-à-dire que la surface présente des espaces), lissez les trous.

Voici un exemple de nombres d'Euler tirés de l'article Wikipédia ; un cercle (juste la partie de ligne) a une caractéristique d'Euler de zéro alors qu'un disque (le cercle "rempli") a la valeur 1.

Performance trap: general libraries & helper objects

Nous ne sommes cependant pas ici pour parler de définition ou de calcul des nombres d'Euler. Nous expliquerons en quoi le chemin simple de la bibliothèque pour calculer les nombres d'Euler est assez inefficace.

Tout d'abord. Nous avons remarqué le problème en examinant ce profil à l'aide de Speedscope :

Performance trap: general libraries & helper objects

Il montre ~ 32 ms (~ 15 %) dépensés en accessoires régionaux. Cette vue est lourde à gauche, si nous passons en vue chronologique et zoomons, nous obtenons ceci :

Performance trap: general libraries & helper objects

(Notez que nous faisons cela deux fois, donc ~16 ms ici et ~16 ms ailleurs, non illustré.)

C'est immédiatement suspect : la partie "intéressante" de la recherche des objets avec find_objects est ce premier ruban, 0,5 ms. Il renvoie une liste de tuples, pas un générateur, donc quand c'est fait, c'est fait. Alors, qu'est-ce qui se passe avec tous les autres trucs ? Nous construisons des objets RegionProperties. Zoomons sur l'un d'entre eux.

Performance trap: general libraries & helper objects

Les minuscules éclats (sur lesquels nous ne zoomerons pas) sont des appels __setattr__ personnalisés : les objets RegionProperties prennent en charge l'alias, par exemple si vous définissez l'attribut ConvexArea, il redirige vers un attribut standard area_convex. Même si nous ne l'utilisons pas, nous passons toujours par le convertisseur d'attributs.

De plus : nous n'utilisons même pas la plupart des propriétés calculées dans les propriétés de la région. Nous ne nous soucions que du numéro Euler :

props = regionprops(np.squeeze(label_img.astype('int')), cache=False) for prop in props: if prop.euler_number

à son tour, cela n'utilise que l'aspect le plus basique des propriétés de région : les régions d'image détectées par find_objects (tranches de l'image originale).

Nous avons donc modifié le code en code fill_holes pour simplement contourner la fonction générale regionprops. Au lieu de cela, nous appelons find_objects et transmettons les sous-régions d'image résultantes à la fonction euler_number (et non à la méthode sur un objet RegionProperties).

Voici la pull request : deepcell-imaging#358 Ignorer la construction des accessoires de région

En ignorant l'objet intermédiaire, nous avons obtenu une amélioration décente des performances pour l'opération fill_holes :

Taille de l'image	Avant	Après	Accélération
260 000 pixels	48 ms	40 ms	8 ms (17 %)
140 millions de pixels	15,6 s	11,7s	3,9 s (25 %)

Pour une image plus grande, 4s représente environ 3 % de la durée d'exécution globale – pas la majeure partie, mais pas trop mal non plus.

Déclaration de sortie Cet article est reproduit sur : https://dev.to/dchaley/performance-trap-general-libraries-helper-objects-h2k?1 En cas de violation, veuillez contacter [email protected] pour le supprimer.

Dernier tutoriel Plus>

Quand utiliser "essayez" au lieu de "si" pour détecter les valeurs variables dans Python?
en utilisant "essayez" vs. "If" pour tester la valeur de variable dans python dans python, il existe des situations où vous ...

La programmation Publié le 2025-07-16
Pourquoi les images ont-elles encore des frontières en chrome? `Border: Aucun;` solution non valide
Suppression de la bordure d'image en chrome Un problème fréquent rencontré lorsque vous travaillez avec des images dans Chrome et IE9 est ...

La programmation Publié le 2025-07-16
Comment ajouter la base de données MySQL à la boîte de dialogue DataSource dans Visual Studio 2012?
Ajout de la base de données MySQL à la boîte de dialogue DataSource dans Visual Studio 2012 En travaillant avec Entity Framework et MySQL, l&#...

La programmation Publié le 2025-07-16
Causes et solutions pour la défaillance de la détection du visage: erreur -215
Gestion des erreurs: résolution "Erreur: (-215)! Vide () Dans la fonction détectMultiSCALE" dans OpenCv lorsque vous pouvez utiliser...

La programmation Publié le 2025-07-16
Comment utiliser correctement les requêtes avec des paramètres APD?
en utilisant des requêtes comme les pDo lorsque vous essayez d'implémenter comme des requêtes dans PDO, vous pouvez rencontrer des problèm...

La programmation Publié le 2025-07-16
Comment puis-je concaténer en toute sécurité le texte et les valeurs lors de la construction de requêtes SQL dans GO?
Concaténation du texte et des valeurs dans go sql requêtes Lors de la construction d'une requête SQL de texte dans GO, il y a certaines rè...

La programmation Publié le 2025-07-16
Comment créer des variables dynamiques dans Python?
Création de variables dynamiques dans python La capacité de créer des variables dynamiquement peut être un outil puissant, en particulier lors...

La programmation Publié le 2025-07-16
Comment puis-je créer efficacement des dictionnaires en utilisant la compréhension Python?
Python Dictionary Comprehension Dans Python, les compréhensions du dictionnaire offrent un moyen concis de générer de nouveaux dictionnaires. Bi...

La programmation Publié le 2025-07-16
Pourquoi Pytz montre-t-il des décalages de fuseau horaire inattendus initialement?
Dicontenance du fuseau horaire avec pytz Certains flammes de temps présentent des décalages particuliers lorsqu'ils sont initialement obte...

La programmation Publié le 2025-07-16
Raisons de CodeIgniter à se connecter à la base de données MySQL après le passage à MySQLI
Impossible de se connecter à la base de données MySQL: dépannage du message d'erreur Lorsque vous tentez de passer du pilote MySQL vers le...

La programmation Publié le 2025-07-16
Comment découvrir dynamiquement les types de packages d'exportation dans le langage Go?
Recherche de types de packages exportés dynamiquement Contrairement aux capacités de découverte de type limité dans le package de réflect, cet...

La programmation Publié le 2025-07-16
Comment définir dynamiquement les touches dans les objets JavaScript?
Comment créer une clé dynamique pour une variable d'objet JavaScript lorsque vous essayez de créer une clé dynamique pour un objet JavaScrip...

La programmation Publié le 2025-07-16
Comment modifier efficacement l'attribut CSS du ": après" pseudo-élément utilisant jQuery?
Comprendre les limites des pseudo-éléments dans jQuery: accéder au ": après" sélecteur dans le développement Web, des pseudo-élément...

La programmation Publié le 2025-07-16
CSS peut-il localiser les éléments HTML basés sur une valeur d'attribut?
ciblant les éléments html avec n'importe quelle valeur d'attribut dans CSS Dans CSS, il est possible de cibler les éléments basés sur ...

La programmation Publié le 2025-07-16
Pourquoi l'exécution de JavaScript cesse-t-elle lors de l'utilisation du bouton Firefox Retour?
Problème d'histoire de la navigation: JavaScript cesse d'exécuter après avoir utilisé le bouton de retour de Firefox Les utilisateurs ...

La programmation Publié le 2025-07-16

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article