Informática Aplicada a la Investigación Rotating Header Image

Uncategorized @eu

SCIPION

Informazio orokorra

Scipion is an image processing framework to obtain 3D models of macromolecular complexes using Electron Microscopy.Versión de Mayo de Github.

Nola erabili

SCIPION erabiltzeko exekutatu

/software/bin/scipion

Informazio gehiago

SCIPION web orrialdea

Qbox

Informazio Orokorra

Bertsioa: 1.62.3

Qbox is a C++/MPI scalable parallel implementation of first-principles molecular dynamics (FPMD) based on the plane-wave, pseudopotential formalism. Qbox is designed for operation on large parallel computers.

Nola Erabili

Lanak bidaltzeko send_qbox tresna prestatu dugu honako erabilerarekin:

send_qbox JOBNAME NODES PROCS_PER_NODE[property] TIME

send_box [Enter] egikarituta erabilgarri dauden beste hainbat aukera erakutsiko dira. Programa /software/qbox katalogoan dago kokatuta.

Informazio Gehiago

Qbox Web orrialdea.

MetAMOS

Informazio orokorra

MetAMOS represents a focused effort to create automated, reproducible, traceable assembly & analysis infused with current best practices and state-of-the-art methods. MetAMOS for input can start with next-generation sequencing reads or assemblies, and as output, produces: assembly reports, genomic scaffolds, open-reading frames, variant motifs, taxonomic or functional annotations, Krona charts and HTML report. 1.5rc3 version.

Nola erabili

Koletara lanak bidaltzeko

send_metamos

komandoa erabili daiteke eta egiten dituen galderak erantzuten. Kontutan hartu MetAMOS memoria asko behar duela, gutxi gorabehera RAM GB bat milioi read bakoitzeko.

Informazio gehiago

MetAMOS web orrialdea.

QIIME

Information orokorra

QIIME (Quantitative Insights Into Microbial Ecology) is an open-source bioinformatics pipeline for performing microbiome analysis from raw DNA sequencing data. QIIME is designed to take users from raw sequencing data generated on the Illumina or other platforms through publication quality graphics and statistics. This includes demultiplexing and quality filtering, OTU picking, taxonomic assignment, and phylogenetic reconstruction, and diversity analyses and visualizations. QIIME has been applied to studies based on billions of sequences from tens of thousands of samples

Nola erabili

QIIME lanak bidaltzeko exekutatu

send_qiime

eta erantzun galdereí.

USEARCH

QIIME USEARCH paketea erabili dezake.

Informazio gehiago

QIIME home page.

USEARCH.

 

 

ABySS

Informazio orokorra

1.3.2 ABySS bertsioa (Assembly By Short Sequences). ABySS is a de novo, parallel, paired-end sequence assembler that is designed for short reads. ABySS paraleloan exekutatu daiteke.

Begiratu ere instalatuta dagoen velvet eta biak konparatzen publikatu dugun artikulua.

Nola erabili

Exekutableak /software/abyss/bin karpetan daude. Kolako skriptetean exekutatzeko gehitu adibidez:

/software/abyss/bin/abyss-pe [abyss-pe opzioak]

Errendimendua

Begiratu ere instalatuta dagoen velvet eta biak konparatzen publikatu dugun artikulua.

Paralelizazioa

Abysseko benchmark batzuk egin dira. Benchmarkak HeSeq2000 NGS Illumina batek emandako datuegin egin dira 100 bp sekuentzia bakoitzeko. 1. taulan ikus dezakegu nola ABySSek eskalatzen duen kore kopuruaren arabera, ikus daitekeen bezala ondo paralelizatzen du 8 kore arte.

Taula 1. abyss-pe programaren exekuxio denbora segundutan kore kopuruaren arabera.
Koreak 2 4 8 12 24
Denbora (s) 47798 27852 16874 14591 18633
Azelerazioa 1 1.7 2.8 3.3 2.6
Errendimendua (%) 100 86 71 55 21

Exekuzio denbora

Exekuxio denbora era neurtu dugu datu tamainaren funtzioan. 2. taulan erakusten da nola milioi bat sekuentziatik 10 milioietara pasatzean denbora ere 10 aldiz handiagoa dela. 10 milioitin 100 milioi sekuentzietara pasatzean denbora 10 eta 20 artean handitzen da. Beraz, exekuzio denboraren konportamendua gutxi gorabehera lineala da.

Taula 2. abyss-pe programaren exekuzio denbora segundutan sekuentzia kopuruaren arabera en 2, 4 y 8 koreentzako.
Sekuentziak 10e6 10e7 10e8
Denbora 2 koretan (s) 247 2620 47798
Denbora 4 koretan (s) 134 1437 27852
Denbora 8 koretan (s) 103 923 1687

RAM memoria

Programa hauetan exekuzio denbora baino garrantzitzua RAM memoria da, oso handia izan baitaiteke. 3. taulan ikusten dugu nola RAM memoria handitzen den sekuentzia kopuruaren funtzioan. Neurtutako balioen logaritmoak ere erakusten ditugu hauek erabili baititugu erregresio lineala egiteko. Kalkuluan 12 koretan egin dira.

Taula 3. abyss-pe programak erabilitako RAM memoria sekuentzia kopuruaren funtzioan. Balioen logaritmoak ere erakusten dira.
Sekuentziak 10e6 5*10e6 10e7 5*10e7 10e8
RAM (GB) 4.0 7.6 11 29 44
log(sekuentziak) 6 6.7 7 7.7 8
log(RAM) 0.60 0.88 1.03 1.46 1.65

Neurtutako balioak ondoko ekuaziora doitu ditugu non (s) sekuentzia kopurua da eta memoria GBetan ematen da:

log(RAM)=0.53*log(s)-2.65

edo beste era batean

RAM=(s^0.53)/447

Ondorioak

RAM erabilera txikiagoa da beste ensanbladorekin alderatuta.  Velvet adibidez (ikus ere Velvet performance in the machines of the Computing Service of the UPV/EHU txostena eta biak konparatzen publikatu dugun artikulua. Gainera, ABySS MPI erabiltzen du paralelizazioa lortzeko eta honi esker hainbat nodoen RAM memoria gehitu dezakegu kalkulu handiagoak egin ahal izateko.

Informazio gehiago

ABySSeko web orrialdea.
Velvet ensambladorea.
hpc blogean sarrera: Velvet performance in the machines of the Computing Service of the UPV/EHU.
Velvet performance in the machines of the Computing Service of the UPV/EHU txostena.

Gulp 4.0

Informazio Orokorra

GULP programak  materialeen  era askotako simulazioak  egin dintzake 0-D  (molekula eta klusterrak), 1-D (polimeroak), 2-D (azalerak, lauza, …) da , edo 3-D (solidoa peridikoak).  Kodearen helburua soluzio analitiko bat lorztea da da, “sare dinamika” (ahal denean) erabiltzen  dinamika molekularraren ordez. Indarr-eremu anitzak erabili ditzake.

Erabili aurretik mesedez begira bere erabilera baldintzak.

Guinness:/Softwarea/Gulp katalogoan instalatuta dago.

Nola erabili

send_gulp

  • GULP ilarara bidaltzeko   send_lmp tresna sortu dugu. Komando sintaxia honakoa da:
  • send_gulp JOBNAME NODES PROCS_PER_NODE TIME [ MEM ] [``Other queue options'' ]
JOBNAME: Is the  name of the input with extension.
NODES: Number of nodes.
PROCS: Number of  processors.
TIME: Time requested to the queue system, format hh:mm:ss.
MEM: Optional. Memory in Gb ( It will used 1GB/core if not set).
[``Other Torque Options'' ] Optional. There is the possibility to pass more variables to the queuing system.
See examples below.   More information about this options

Adibideak

  • Job1  lana nodo batera eta 4 prozesagailuetara bidali dugu, 4 ordutarako:
  • send_gulp job1.gin 1 4 04:00:00
  • Lana  2 nodo eta 8 prozesagailutara  eskatutako denbora  192 ordutakoa izanik. Memoria ere adierazi dugu,  8 GB, eta lana ez da 1234.  lana amaitu aurretik martxan jarriko.
  • send_gulp job2.gin 2 8 192:00:00 8 ``-W depend=afterany:1234'
  • Lana 4 nodo eta 4 prozesagailuetara bidali dugu. 200 ordu eta 2 GB-etako RAM-a askatu dugu. Gainera, kalkulua hasi eta amaitzean email bat bidaliko digu adierazitako emailera .
  • send_gulp job.gin 4 4 200:00:00 2 ``-m be -M mi.email@ehu.es''

    Lanen Monitorizazioa

    GULP lanaen jarraipena egiteko  remote_vi tresna erabili daiteke.

    remote_vi JOBID

    *. out fitxategia erakutsiko digu.  (Lana send_gulp-rekin bidali bada soilik).

    Informazio gehiago

    http://projects.ivec.org/gulp/

    XCrySDen

    Informazio orokorra

    XcrysSDen egitura kristalinoak eta molekularrak ikusteko programa da. Gainazal,  kontornoak eta egitura atomikoak marrazten ditu. Interaktiboki aldatu daitezke.

    Nola erabili

    XCrySDen erabiltzeko exekutatu:

    xcrysden
    

    Aplikazio grafikoak ireki ahal izateko (begiratu nola konektatu).

    Informazio gehiago

    XCrySDen web orrialdea.

    GRETL

    Informazio orokorra

    Gretl (Gnu Regression, Econometrics and Time-series Library) ekonometriako programa bat da. 1.9.6. bertsioa dago eskuragarri

    Ezaugarriak

    • Incluye una gran variedad de estimadores: mínimos cuadrados, máxima verosimilitud, GMM; de una sola ecuación y de sistemas de ecuaciones
    • Métodos de series temporales: ARMA, GARCH, VARs y VECMs, contrastes de raíces unitarias y de cointegración, etc.
    • Variables dependientes limitadas: logit, probit, tobit, regresión por intervalos, modelos para datos de conteo y de duración, etc.
    • Los resultados de los modelos se pueden guardar como ficheros LaTeX, en formato tabular y/o de ecuación.
    • Incluye un lenguaje de programación vía ‘scripts’ (guiones de instrucciones): las órdenes se pueden introducir por medio de los menús o por medio de guiones.
    • Estructura de bucles de instrucciones para simulaciones de Monte Carlo y procedimientos de estimación iterativos.
    • Controlador gráfico mediante menús, para el ajuste fino de los gráficos Gnuplot.
    • Enlace a GNU R, GNU Octave y Ox para análisis más sofisticados de los datos.

    Nola erabili

    Gretl erabiltzeko exekutatu:

    /software/bin/gretlcli

    Informazio gehiago

    Gretl web orrialdea.

    Nola bidali Terachem

    Sarrera

    Torque script bat eraiki dezakezu kolara bidaltzeko edo send_terachem komandoa erabili

    send_terachem

    Terachem lanak bidaltzeko send_terachem agindua sortu dugu.

    send_terachem JOBNAME TIME MEM [``Other queue options'']

    non

    JOBNAME: terachemren sarrera datuen fitxategia.
    TIME: Kaluluaren denbora hh:mm:ss fromatuan
    MEM: memoria Gb-etan eta unitatea adierazi gabe
    [``Other queue options''] Kola sistemari pasa nahi zaizkion beste aukerak.

    Adibideak

    • job1 inputa duen kalkulua memoria Gb batekoa eta denbora 4 ordu izanik.
    send_terachem job1 04:00:00 1
    • job3 inputa duen kalkuluari memoria 8 Gb batekoa eta denbora 60 ordu izanik. Gainera 1234 lana bukatu ondoren abiatu daitekela soilik adieratzen dugu.
    send_terachem job3 60:00:00 8  ``-W depend=afterany:1234''>
    • job3 inputa bidalzten dugu memoria 15 Gb-etakoa eta denbora 400 ordu izanik. Gainera, lana hasi eta bukatzean email bat bidaltzeko adierazten dugu nire.emaila@ehu.es helbidera.
    send_terachem job3 400:00:00 15 ``-m be -M nire.emaila@ehu.es''

    Terachem

    Informazio orokorra

    TeraChem 1.45 is general purpose quantum chemistry software designed to run on NVIDIA GPU architectures under a 64-bit Linux operating system. Some of TeraChem features include:

    • Full support for both NVIDIA Tesla and Fermi GPUs
    • Restricted Hartree-Fock and Kohn-Sham single point energy and gradient calculations
    • Various DFT functionals (BLYP, B3LYP, PBE, etc) and DFT grids (800-80,000 grid points per atom)
    • Empirical dispersion corrections (DFT-D)
    • Geometry optimization and transition state search (including constraints)
    • Ab initio molecular dynamics (NVE and NVT ensembles)
    • Support of multiple-GPU systems
    • Up to 1000 times faster than conventional CPU-based codes
    • Designed for large molecules – reads/writes PDB files directly
    • Optimization including geometric constraints
    • Improved mixed-precision for increased accuracy

    Nola bidali Terachem

    send_terachem komandoa badago lanak klusterrera bildaltzeko prozesua errazteko.

    Informazio gehiago

    Página de Terachem.

    Erabiltzailearen eskuliburua.

    GSL

    Liburutegi matematikoen 1.16 bertsioa. Hauek sortzen dituzte: ausazko zenbakiak, funtzio bereziak, fft, algebra lineala… guztira 1.000 funtzio baino gehiago.

    Nola linkatzen diren jakiteko exekutatu

    gsl-config
    

    Informazio gehiago  GSL homepage.

    VMD

    Informazio orokorra

    VMD is designed for modeling, visualization, and analysis of biological systems such as proteins, nucleic acids, lipid bilayer assemblies, etc. It may be used to view more general molecules, as VMD can read standard Protein Data Bank (PDB) files and display the contained structure. VMD provides a wide variety of methods for rendering and coloring a molecule: simple points and lines, CPK spheres and cylinders, licorice bonds, backbone tubes and ribbons, cartoon drawings, and others. VMD can be used to animate and analyze the trajectory of a molecular dynamics (MD) simulation. In particular, VMD can act as a graphical front end for an external MD program by displaying and animating a molecule undergoing simulation on a remote computer.

    Nola erabili

    Erabiltzaileek ziurtatu behar dute Zerbitzuko makinetan exekutatu aplikazio grafikoak erabiltzaile bakoitzaren ordenagailuan ikuzi ahal dituela. Hori zerbitzura nola konektatu atalean azaltzen da.

    VMD exekutatzeko erabili

    vmd

    Informazio gehiago

    VMD homepage.