Nouveautés de DataSpell 2024.1

DataSpell 2024.1 : saisie semi-automatique de code en ligne entière, possibilité d'interroger des DataFrames via des cellules SQL, cellules Import Data, amélioration de la prise en charge de dbt

Notre équipe de ML a amélioré le modèle local utilisé pour la saisie semi-automatique de code en ligne entière assistée par ML pour Python. La complétion fournit ainsi des suggestions plus longues et prenant en compte davantage de contexte, sans envoyer de données sur Internet et entièrement gratuitement.

DataSpell 2024.1 permet d'écrire du code SQL pour interroger des data frames et des fichiers CSV directement dans vos notebooks Jupyter. Cette mise à jour introduit un nouveau type de cellule dans DataSpell : les cellules Import Data. Vous pouvez facilement commencer à travailler avec des données tabulaires en y déposant un fichier.

Cette version améliore considérablement la prise en charge de dbt Core. Vous pouvez maintenant visualiser des graphiques directement dans DataSpell. Nous avons amélioré la saisie semi-automatique de code pour les projets dbt Core et vous pouvez dorénavant exécuter, prévisualiser et tester des modèles directement à partir du fichier SQL.

Téléchargez la nouvelle version de DataSpell sur notre site web, mettez votre version à jour directement depuis l'IDE ou via notre application gratuite Toolbox App, ou utilisez des paquets snap pour Ubuntu.

Saisie semi-automatique du code assistée par ML

Notre équipe ML a considérablement amélioré le modèle local utilisé pour alimenter la saisie semi-automatique de code en ligne entière pour Python. Elle génère maintenant de meilleures suggestions, plus longues et prenant en compte un contexte plus large, et contribue ainsi à réduire votre travail de saisie. Le modèle est purement local et suggère donc des lignes entières de codes sans envoi de données à un serveur externe.

SQL pour les DataFrames et les fichiers CSV

Dans DataSpell 2024.1, vous pouvez écrire du code SQL pour interroger des DataFrames et des fichiers CSV directement à partir de votre notebook Jupyter. Pour ce faire, créez une cellule SQL, sélectionner un DataFrame comme source de données, puis écrivez une requête à l’aide de l'assistance au codage SQL.

Cellules Import Data

Autre nouvelle fonctionnalité pour les notebooks Jupyter dans DataSpell 2024.1 : les cellules Import Data. Déposez simplement un fichier contenant des données tabulaires dans une cellule Import Data et vous pourrez travailler sur ce fichier à l'aide de contrôles visuels ou de code Python.

dbt Core

La dernière version introduit plusieurs nouveautés pour la prise en charge de dbt :

Les DAG sont de puissants outils pour les ingénieurs analytiques et cette mise à jour permet d’afficher les graphiques directement dans DataSpell. La navigation est également facilitée : il vous suffit de cliquer sur les nœuds dans le DAG.

La saisie semi-automatique de code pour les projets dbt Core a été considérablement améliorée, notamment pour Jinja, les noms de modèles, les noms de colonnes, les fichiers YAML, entre autres.

Vous pouvez désormais exécuter, prévisualiser et tester tout modèle directement à partir du fichier SQL. Il suffit de cliquer dans la gouttière et de choisir parmi les options disponibles.

Nous espérons que vous apprécierez ces nouvelles fonctionnalités ! Vous souhaitez être au courant des dernières fonctionnalités et recevoir des conseils sur DataSpell et l'analyse des données ? Abonnez-vous à notre blog et suivez-nous sur X (ex-Twitter) ! Si vous rencontrez un bug ou souhaitez nous suggérer des fonctionnalités, indiquez-le dans notre outil de suivi des tickets.