Projet de composants/routines pour Talend Open Studio
Ces composants et routines sont destinés à fournir de nouveaux connecteurs ou de nouvelles fonctionnalités dans les jobs créés avec Talend Open Studio.
Ce répertoire contient des routines utilitaires :
StaticMap
: Map de données statique, permettant le partage de données entre un job et ses sous-jobs, ou entre un job et une application java appelante.StaticThreadLocalMap
: Map de données statique, mais instanciée par Thread. Elle permet à plusieurs instance d’un même job tournant dans différents Thread d’une même JVM d’utiliser cette Map sans collision.
Composants de lecture/écriture/manipulation de fichiers :
bcFileListExt
: extension du composanttFileList
, permettant d’avoir plusieurs patterns d’exclusion au lieu d’un seul.bcFileOutputOOSpreadsheet
: composant permettant d’écrire les données dans un fichier au format Open Document SpreadSheet (ODS).tFileDigester
: calcul de la clé de hachage d’un fichier, selon plusieurs algorithmes (SHA, MD5, etc.)bcFileOutputSQL
: ce composant a pour but de créer un fichier script d’ordres SQL à partir des données entrantes. Le développement de ce composant peut être suivi dans la branche bcFileOutputSQL
Composants utilitaires :
bcAggregateRow
: extension du composanttAggregateRow
offrant des fonctions d’agrégation sur des données booléennes (et logique, ou logique, ou exclusif).tBufferCopyInput
: extension du composanttBufferInput
permettant la lecture des données à partir d’une copie du buffer, effectuée à l’initialisation du composant.tBufferOutput
: extension du composanttBufferOutput
permettant d’effacer le buffer avant de l’utiliser. Cela permet d’enchaîner plusieurs utilisations du buffer dans un même job.tRunJobRow
: extention du composant “tRunJob” permettant d’avoir des flux de données en entrée et en sortie du sous-job.bcResourceInputProperties
: lecture d’un fichier “properties” depuis le classpath du programme. Ce composant permet (entre autres) de lire des fichiers non décompressés à l’intérieur d’archives JAR.
Composants dédiés au logging (Log4J et Logback). Les dernières versions de ces composants sont développées dans la branche de développement dédiée Logging :
bcLogback
: utilisation du framework de logging Logback au travers de slf4J.bcLogbackCatch
: interception des logs natives du job, et redirection vers le framework Logback (au travers de slf4J)bcLogbackConfig
: configuration du framework de logging Logback.tInitLog4J
: configuration du framework de logging Log4J.tLog4J
: écriture de logs utilisant le framework Log4J.tLog4JCatch
: interception des logs natives du job et redirection vers le framework Log4J.
La série de composants bcOAI...
permet d’avoir des composants pour lire des données en utilisant le protocole OAI-PMH. Les dernières versions de ces composants sont dans la branche de développement dédiée bcOAI :
bcOAIIdentifyInput
: lecture de l’identification du serveur OAI-PMH.bcOAIIdentifiersInput
: lecture des identifiants des objets “moissonnables”.bcOAIMetadatasInput
: lecture des formats de métadonnées supportés par le serveur.bcOAIRecordInput
: lecture d’un enregistrement particulier à partir de son identifiant.bcOAIRecordsInput
: moissonnage des objets connus du serveur.bcOAISetsInput
: lecture des “ensembles” (sets) disponibles sur le serveur.
Vous pouvez installer les composants manuellement à partir des sources, en les copiant dans le répertoire $TOS_HOME/plugins/org.talend.designer.components.ecosystem_$TOS_VERSION/component
ou en les téléchargeant depuis Talend Exchange (opération réalisable directement depuis Talend Open Studio).
Vous pouvez cloner le projet des composants depuis Github :
git clone git://github.com/bcourtine/Composants-Talend-Open-Studio.git
Les bugs et les demandes d’évolution du module sont à soumettre sur GitHub.
- Le composant
bcFileOutputOOSpreadsheet
doit être complété, en particulier pour traiter correctement les données de type “Date”. - Une série de composants
bcDataSource...
est prévue pour lire/écrire des données fournies par une DataSource (d’un serveur d’applications). Le développement de ces composants peut être suivi dans la branche datasource - Un composant
bcFileInputXML
(évolution detFileInputXML
) est prévu pour permettre la lecture de fichiers XML ayant des noeuds de cardinalité > 1 dans la boucle de données. Le développement de ce composant peut être suivi dans la branche XML.