9/9/08

BIOINFORMATICA, USOS Y APLICACIONES EN ALGORITMOS UTILIZADOS EN EL PLEGAMIENTO GENÉTICO DE LAS PROTEÍNAS.

Introduccion


Este trabajo explicará en términos muy generales que es bioinformática y tratara de manera sucinta cómo un Biomédico Molecular, puede usar los programas de computadora para el análisis de las secuencias.

Esperamos que el presente trabajo proporcione la dirección en cuanto a cómo acercarnos a este tema difícil, ya que es de gran interés para los Biomédicos interesados en el uso de esta disciplina a los problemas del análisis biológico de la secuencias de ADN y Proteínas, etc.

El presente estudio le ayudara a considerar lo que es la bioinformática y donde están los problemas más importantes.

Además encontrara las diferentes bases de datos de ADN, Proteínas, Genomas, entre otras. Todas de suma importancia para el análisis y una mejor comprensión de los datos encontrados en el laboratorio.

De la misma manera se tratara de aumentarle la curiosidad hacia la utilización de estos sistemas como herramienta necesaria en su laboratorio y vida profesional, es por esto que hablaremos tambien del plegamiento y evolucion de la proteinas por medio de sistemas simulados de computación, etc…

BIOINFORMÁTICA

Bioinformática es la aplicación de los ordenadores y los métodos informáticos en el análisis de datos experimentales y simulación de los sistemas biológicos. Una de las principales aplicaciones de la bioinformática es la simulación, la minería de datos (data mining) y el análisis de los datos obtenidos en el estudio de moléculas relevantes para la vida, por ej. El ADN/ARN/genoma (Proyecto Genoma Humano) o las proteínas proteoma, así como el diseño y desarrollo de herramientas tales como por Ej. Bases de datos, directorios Web, etc.
Una definición mucho más global es:
Bioinformática es la aplicación del desarrollo de la computación y las matemáticas que permite la administración, análisis y comprensión de datos para resolver preguntas biológicas. (Con conexiones a medí-, quimio-, neuro-, etc. informática). Modificado de: Center for Research on Innovation and Competition (Harvey & Mc. Meekin, 2002).
Dos escuelas, la de EE.UU. y la del Reino Unido con Australia le dan diferentes coberturas al término.
Para los estadounidenses la bioinformática se enmarca dentro de lo mencionado en el párrafo anterior.
Para los británicos la bioinformática se extiende al estudio de cualquier tipo de datos obtenidos de entidades biológicas independientemente de la escala de estudio, desde moléculas hasta paisaje, ecosistemas, etc.
La bioinformática se nutre especialmente de dos grandes áreas del conocimiento, las ciencias biológicas y las ciencias de la computación, dado este origen existen dos grandes líneas de trabajo:
La primera en la cuál las ciencias de la computación utilizan modelos de las biológicas, ejemplo de ello lo constituyen las redes neurales, los algoritmos genéticos, computación con DNA, entre otras.
La segunda en la cuál las ciencias biológicas utilizan modelos y herramientas de las ciencias de la computación, como se menciona en el primer párrafo.





2.1. La Bioinformática Como Disciplina Científica O Técnica De Apoyo A La Investigación.
Con el incremento en complejidad y capacidad tanto de las computadoras como de las técnicas de investigación, se necesitan "puentes" humanos que puedan entender ambas disciplinas y sean capaces de comunicarse con los expertos de los dos campos.
Históricamente, el uso de las computadoras para resolver cuestiones biológicas comenzó con el desarrollo de algoritmos y su aplicación en el entendimiento de las interacciones de los procesos biológicos y las relaciones filogenéticas entre diversos organismos.
El incremento exponencial en la cantidad de secuencias disponibles, así como la complejidad de las técnicas que emplean las computadoras para la adquisición y análisis de datos, han servido para la expansión de la bioinformática.
La diferencia entre una disciplina científica y un campo de apoyo es que la primera implica una investigación basada en el planteamiento de hipótesis, mientras que el segundo sólo se encarga de apoyar esa investigación.
La bioinformática se ha ocupado desde un principio en realizar investigaciones basadas en hipótesis. Las teorías de la evolución molecular se han estudiado empleando para ello la genómica post-secuenciación, donde se han examinado teorías de interacciones y procesos complejos como la excitación nerviosa empleando la modelización molecular. La Bioinformática está comenzando a ser considerada como disciplina científica, como se evidencia en el incremento de publicaciones y reuniones científicas en esta área.
Hay mucho campo de investigación basado en hipótesis en el área bioinformática de las bases de datos. El reto en la construcción de bases de datos es el establecimiento de una arquitectura que permita la realización de búsquedas inteligentes, comunicación con otras bases de datos y la unión con herramientas de análisis y como se menciono anteriormente con la minería de datos específicos que permitan dar respuesta a problemas biológicos concretos. Los científicos que se encarguen de la construcción de esas bases de datos deben tener unos conocimientos previos que les permitan determinar qué problemas científicos concretos necesitan una resolución y cuál o cuáles métodos son los mejores para resolverlos.





2.2. La Bioinformática Comprende Sus Subespecialidades.

2.2.1 Bioinformática En Sentido Estricto.
La investigación y desarrollo de la infraestructura y sistemas de información y comunicaciones que requiere la biología moderna. (Redes y bases de datos para el genoma, estaciones de trabajo para procesamiento de imágenes).

2.2.2. Biología Molecular Computacional.
La computacional que se aplica al entendimiento de cuestiones biológicas básicas, mediante la modelización y simulación. (Sistemas de Vida Artificial, algoritmos genéticos, redes de neuronas artificiales).

2.2.3. Biocomputación
El desarrollo y utilización de sistemas computacionales basados en modelos y materiales biológicos. (Biochips, biosensores, computación basada en ADN). Los computadores basados en DNA se están empleando para la secuenciación masiva y el screening de diversas enfermedades, explotando su característica de procesamiento paralelo implícito. Figura 1.

Básicamente, los sistemas informáticos se emplean en este campo para:
Adquisición de datos.
Software para visualización.
Programas para control de reactivos, geles y otros materiales.
Generación y ensamblaje de secuencias.
Análisis de datos.
Programas para análisis de secuencias.
Predicción de estructura de proteínas.
Paquetes de integración y ensamblaje de mapas genéticos.
Software para clasificación y comparación.
Técnicas de Inteligencia Artificial.
Gestión de datos.
Bases de datos locales o accesibles mediante redes de comunicaciones.
Distribución de datos.
Redes de comunicaciones.
2.4. Campos de aplicación De La Bioinformática.

Gestión de datos en el laboratorio.
Automatización de experimentos.
Ensamblaje de secuencias contiguas.
Predicción de dominios funcionales en secuencias génicas.
Alineación de secuencias.
Búsquedas en las bases de datos de estructuras.
Determinación de la estructura de macromoléculas.
Predicción de la estructura de macromoléculas.
Evolución molecular. Árboles filogenéticos.
3. Algunos Datos Para Entender La Magnitud Del Proyecto Y El Papel De La Bioinformática.
El Genoma Humano contiene unos 3.000 millones de pares de bases.
Contiene unos 100.000 genes.
Sólo un 10 % del genoma codifica proteínas
Se conoce la localización de unos 3000 genes
Hay 24 pares de cromosomas; el menor tiene unos 50 millones de pares de bases, el mayor unos 250 millones.
Si se reunieran, los datos del genoma ocuparían 1000 libros de 200 páginas
La diversidad genética humana: 5.000 millones de personas que se diferencian en un 0,1% de su material genético. Esto genera un catálogo de diferencias en secuencias teórico de 5000 billones de registros. Figura 3.
EE.UU. ha dedicado 3.000 millones de dólares a lo largo de los 15 años que dura el proyecto.

4. Bioinformática Y Genómica funcional - La Era Post-Genómica
4.1. La Genómica Estructural es la rama de la genómica orientada a la caracterización y localización de las secuencias que conforman el DNA de los genes, permitiendo de esta manera la obtención de mapas genéticos de los organismos,
4.2. La Genómica Funcional es la disciplina que se orienta hacia la recolección sistemática de información acerca de las funciones desempeñadas por los genes.
Para llevar a cabo este trabajo se requiere, mediante el desarrollo y la aplicación de unas aproximaciones experimentales globales, la información procedente de la genómica estructural. Las metodologías experimentales empleadas han de combinarse con estudios Bioinformaticos de los resultados debido al gran volumen de información que se genera durante los estudios realizados a gran escala. Con la genómica funcional el objetivo es llenar el hueco existente entre el conocimiento de las secuencias de un gen y su función, para de esta manera desvelar el comportamiento de los sistemas biológicos. Se trata de expandir el alcance de la investigación biológica desde el estudio de genes a proteínas individuales al estudio de todos los genes y proteínas al mismo tiempo en un momento determinado.

La Nueva Generación de Bioinformática.
Se introduce el concepto de Bioinformática de Segunda Generación, caracterizada por:
En los últimos años, la bioinformática ha trabajado con muchas bases de datos que almacenaban información biológica a medida que iba apareciendo. Esto no sólo ha tenido efectos positivos: muchos científicos se quejan de la creciente complejidad que representa encontrar información útil en este "laberinto de datos". Para mejorar esta situación, se desarrollan técnicas que integran la información dispersa, gestionan bases de datos distribuidas, las seleccionan automáticamente, evalúan su calidad, y facilitan su accesibilidad para los investigadores.
Se habla de Bioinformática Integradora. En ella no deben faltar ayudas para la navegación por la información, que cada vez, con más énfasis, reside en Internet y no en bases de datos locales, de esto se hablara mas adelante.
En unos años, la comunidad científica tendrá a su disposición la secuencia de bases (3.000 millones de genes) que componen el Genoma Humano; sin embargo, esta información (estructural) es insuficiente para un entendimiento completo de su función, regulación y variación (aproximadamente 80.000 genes). Los procesos celulares son gobernados por el repertorio de genes expresados y su patrón de actividad temporal.
Se necesitan Herramientas para gestionar información genética en paralelo. Para ello se emplean nuevas tecnologías para extracción de conocimiento, minería de datos y visualización. Se aplican técnicas de descubrimiento de conocimiento a problemas biológicos como análisis de datos del Genoma y Proteoma.
La bioinformática, en este sentido, ofrece la capacidad de comparar y relacionar la información genética con una finalidad deductiva, siendo capaz de ofrecer unas respuestas que no parecen obvias a la vista de los resultados de los experimentos.
Se aprecia una corriente de investigación y desarrollo de nuevas técnicas cuyo objetivo es acelerar el descubrimiento científico, reduciendo costes y aumentando el número de experimentos. Los nuevos equipos analíticos, basados en la ultra miniaturización y paralelismo implícito, se concretan en el diseño de biochips (chips de material biológico de alta densidad de integración). La potencia de estos sistemas trae consigo la obtención, en tiempos muy breves, de grandes volúmenes de información, (secuencias, mutaciones, datos de expresión génica, determinaciones analíticas de interés clínico, screening de fármacos) que necesitan ser gestionados con técnicas bioinformáticas para extraer conocimiento de utilidad en la investigación biomédica.
Fondo Biológico Para El Análisis De La Secuencia.

Los bloques de edificio fundamentales de la vida son las proteínas. Las enzimas, que son las máquinas moleculares responsables de virtualmente todas las transformaciones químicas de las células son las proteínas. Además, muchas de las estructuras de una célula se componen también de proteínas. Esa parte de las estructuras que no se componen de proteínas es producida por las enzimas que son también proteínas. Un ser humano contiene aproximadamente 100.000 proteínas donde todas son diferentes y cumplen una función específica. Donde las interacciones entre ellas son las que nos hacen a todos diferentes.
Las proteínas son de longitud variable linear, formadas por polímeros mezclados de 20 diversos aminoácidos. Otros términos utilizados más o menos utilizados para los polímeros del aminoácido son péptidos y los polipéptidos. Estos polímeros lineares se doblan sobre sí mismos para generar una forma característica de cada diversa proteína, y esta forma junto con las diversas características químicas de los 20 aminoácidos determina la función de la proteína. Uno de los conceptos más importantes de la biología moderna es que las características funcionales de proteínas son determinadas en gran parte por la secuencia de los 20 aminoácidos en la cadena linear del polipéptido.
Así, en teoría, saber la secuencia de una proteína (Orden con la cual los aminoácidos están dispuestos) se podría deducir su función en el organismo.
6.1. Pero Qué Determina El Número De Aminoácidos En Una Proteína
El dogma central de la biología molecular describe cómo la información genética que heredamos de nuestros padres se almacena en la DNA, y esa información se utiliza para hacer copias idénticas de esa DNA y también se transfiere de la DNA al RNA a la proteína. El DNA es un polímero linear del Monofosfato Del Deoxyadenosine de 4 nucleótidos (A abreviada), de Monofosfato Del Deoxythymidine (T abreviado), del Monofosfato Del Deoxyguanosine (G abreviado) y del Monofosfato Del Deoxycytidine (C abreviada). El RNA es un polímero muy similar del Monofosfato De Adenosina, del Monofosfato Del Guanosine, del Monofosfato Del Cytidine, y del Monofosfato Del Uridine. El monofosfato del Uridine, U abreviado, es un nucleótido funcionalmente equivalente al Monofosfato Del Thymidine.
Una característica de la DNA y del RNA es que los polímeros lineares pueden aparearse uno con el otro, tal apareamiento siendo específico de la secuencia. En tales polímeros de doble asumen una forma de doble hélice. G se aparea con pares de C y de A con T o el U. Todas las combinaciones posibles de las hélices dobles de la DNA y del RNA ocurren. Una DNA del filamento puede servir como plantilla para la construcción de un filamento complementario, y este filamento complementario se puede utilizar para reconstruir el filamento original. Ésta es la base de la réplica de la DNA y así de todas las bases genéticas. El filamento complementario o templating similar da lugar a una copia del RNA de una secuencia de la DNA. La conversión de esa secuencia del RNA en una secuencia de la proteína es más compleja. Esto ocurre por la traducción de un código que consiste en tres nucleótidos en un aminoácido, un proceso logrado por la maquinaria celular incluyendo tRNA y los ribosomal rRNA.
Búsqueda En Las Bases De Datos Para Las Secuencias Similares A Una Nueva Secuencia.


Si acaba de determinar una secuencia de un pedacito interesante del DNA, una de las primeras preguntas que debe hacerse es que si es probable que exista ya una secuencia parecida a la encontrada por el investigador. Afortunadamente, ha habido un esfuerzo internacional muy acertado de recoger todas las secuencias que los investigadores, se ha determinado en un lugar o bases de datos que comentare profundamente mas adelante, así que la secuencia puede ser buscada. Para las secuencias de la DNA, tres grupos han cooperado en este esfuerzo, uno en Japón, uno en Europa, y uno en los Estados Unidos (DDBJ, EMBL y GenBank), respectivamente. Estas bases de datos se fusionan con frecuencia uno con otro a de modo que buscar sea virtualmente igual que buscando en los tres. El problema es que estas bases de datos son ENORMES y, consecuentemente, debes comparar tu secuencia con este número extenso de otras secuencias eficientemente.

Un número de programas se han escrito para buscar rápidamente una base de datos para una secuencia de la pregunta, dos de la cual, RÁFAGA y FASTA, serán discutidos también mas adelante. Las técnicas usadas por estos programas para hacer buscar resultados más rápidamente en una cierta pérdida de rigor de la comparación. Es posible encontrar errores aunque para algunos resulta inverosímil que exista una semejanza débil pero relevante y el programa no lo muestre. Además, muchas veces estos programas señalarán una secuencia por medio de una bandera o señal como siendo similares a tu secuencia cuando esta semejanza no es significativa.

Así, estos programas deben ser considerados como herramientas para identificar un subconjunto pequeño de secuencias de la base de datos para la recuperación y fomentar análisis más bien que extremos en sí mismos.
Las bases de datos de las secuencias de la proteína, incluyendo SwissProt y PIR, también existen y pueden ser buscadas semejantemente.
Búsqueda De Genes.
Recoger, organizar y el poner en un índice de la información de la secuencia en una base de datos, es una tarea desafiadora en sí mismo, prevé del científico una abundancia de la información, no obstante del uso limitado de ella. La energía o velocidad de una base de datos viene no de la colección de información, pero si de su análisis. Una secuencia del DNA no constituye necesariamente un gen. Puede constituir solamente un fragmento de un gen o alternativamente, puede contener varios genes, como se menciono anteriormente.
Afortunadamente, en el acuerdo con principios evolutivos, la investigación científica hasta la fecha ha demostrado que todos los genes comparten elementos comunes. esto ha hecho posible que se construyan las secuencias en consenso, esas secuencias que representaban lo mejor de una clase dada de organismos (bacterias, eukaroytes). Los elementos genéticos comunes incluyen promotores, reforzadores, secuencias de la señal del polyadenylacion y sitios obligatorios de la proteína. Estos elementos también se han caracterizado más a fondo en otros subelementos.
Los elementos genéticos comparten secuencias comunes, y es este hecho que permite que los algoritmos matemáticos sean aplicados al análisis de los datos de la secuencia.
Un programa de computadora (Bioinformática) para encontrar genes contendrá por lo menos los elementos siguientes.
Elementos De Un Programa De Computadora Gene-Que Busca
Algoritmos para el reconocimiento de patrón.
Los fórmulas de la probabilidad se utilizan para determinarse si dos secuencias son estadístico similares.
Tablas de los datos.
Estas tablas contienen la información sobre las secuencias del consenso para los varios elementos genéticos. Más información permite un análisis mejor.
Diferencias taxonómicas
Las secuencias del consenso varían entre diversas clases taxonómicas de organismos. La inclusión de estas diferencias en un análisis apresura el proceso y reduce al mínimo error.
Reglas del análisis
Estas instrucciones de programación definen cómo se aplican los algoritmos. Definen el grado de semejanza aceptado y si las secuencias y/o los fragmentos enteros de eso serán considerados en el análisis. Un buen diseño del programa permite a usuarios ajustar estas variables.


11. La Creación De Las Bases De Datos De La Secuencia.
La mayoría de las bases de datos biológicas consisten en cadenas largas de nucleotidos (guanine, adenina, thymine, cytosine y uracilo) y/o de los aminoácidos (threonine, serine, glycine, etc.). Cada secuencia de nucleotidos o los aminoácidos representa un gen o una proteína (o una sección particular de eso), respectivamente. Las secuencias se representan en taquigrafía, usando solas designaciones de la letra. Esto disminuye el espacio necesario para almacenar la información y aumenta el proceso de la velocidad para el análisis.
Bioinformática Y Sus Bases De Datos
Existen bases de datos primarias, que contienen información directa de la secuencia, estructura o patrón de expresión de ADN o proteína, y secundarias, que contienen datos e hipótesis derivados del análisis de las bases de datos primarias, como mutaciones, relaciones evolutivas, agrupación por familias o funciones, implicación en enfermedades, etc.
12.1. De Nucleótidos
La colaboración de las tres bases de datos más importantes hace posible acceder a casi toda la información de secuencias de ADN desde cualquiera de sus tres sedes:
EMBL-BANK en el Instituto europeo de Bioinformática (EBI)
DNA Data Bank Of Japan (DDBJ) en el Centro de Información Biológica (CIB)
GenBank en el Centro Nacional de Información Biotecnológica (NCBI)
12.2. De Proteínas
Bases de datos de secuencias de aminoácidos.
Swissprot contiene secuencias anotadas o comentadas, es decir, cada secuencia ha sido revisada, documentada y enlazada a otras bases de datos.
TrEMBL por Translation of EMBL Nucleotide Sequence Database incluye la traducción de todas las secuencias codificantes derivadas del (EMBL-BANK) y que todavía no han podido ser anotadas en Swissprot.
PIR por Protein Information Resource está dividida en cuatro sub-bases que tienen un nivel de anotación decreciente.
ENZYME enlaza la clasificación de actividades enzimáticas completa a las secuencias de Swissprot.
PROSITE contiene información sobre la estructura secundaria de proteínas, familias, dominios, etc.
INTERPRO integra la información de diversas bases de datos de estructura secundaria como PROSITE, proporcionando enlaces a otras bases de datos e
PDB por Protein Data Bank es la base de datos de estructura terciaria 3-D de proteínas que han sido cristalizadas.
12.3. De Genomas
Ensembl integra genomas eucariotas grandes, por el momemto contiene genoma humano, ratón, rata, fugu, zebrafish, mosquito, Drosophila, C. elegans, y C. briggsae.
Genomes Server y TIGR son portales con información o enlaces de todos los genomas secuenciados por el momento, desde virus a humanos.
Wormbase es el portal del genoma de gusano C. elegans.
Flybase es el portal de la mosca del vinagre Drosophila melanogaster.

12.4. Otras
Taxonomy es el portal de clasificación taxonómica de organismos
Pubmed da acceso gratuito al índice de publicaciones de la Biblioteca Nacional de Medicina (NLM), con enlaces a artículos completos
OMIM por Online Mendelian Inheritance in Man es un catálogo de genes humanos relacionados con informaciones genéticas. Xenobase es el portal del organismo modelo Xenopus lavéis.
UCSC Genome Browser

14.1. Busqueda De Datos De Genoma




Estos datos fueron contribuidos por muchos investigadores, según lo descrito en la página de los créditos del browser del Genoma.


14.2. Tablas Partiendo De Cromosomas




Esta sección demuestra los datos que han estado partidos en una tabla separada para cada cromosoma.

[chr6] [chrN_B] [chrN_C] [chrN_E] [chrN_G] [chrN_H] [chrN_I] [chrN_M] [chrN_R] [chrN_V] [chrN_W] [chrN_Z]
chr6_hla_hap1_chainCanFam1 - Summary info about chain of dog (canFam1) alignments on human chr6_hla_hap1
chr6_hla_hap1_chainCanFam1Link - Alignment block in dog (canFam1) chain on human chr6_hla_hap1
chr6_hla_hap1_chainDanRer1 - Summary info about chain of zebrafish (danRer1) alignments on human chr6_hla_hap1
chr6_hla_hap1_chainDanRer1Link - Alignment block in zebrafish (danRer1) chain on human chr6_hla_hap1
chr6_hla_hap1_chainGalGal2 - Summary info about chain of chicken (galGal2) alignments on human chr6_hla_hap1
chr6_hla_hap1_chainGalGal2Link - Alignment block in chicken (galGal2) chain on human chr6_hla_hap1
chr6_hla_hap1_chainMm5 - Summary info about chain of mouse (mm5) alignments on human chr6_hla_hap1
chr6_hla_hap1_chainMm5 - Alignment block in mouse (mm5) chain on human chr6_hla_hap1
chr6_hla_hap1_chainPanTro1 - Summary info about chain of chimp (panTro1) alignments on human chr6_hla_hap1
chr6_hla_hap1_chainPanTro1Link - Alignment block in chimp (panTro1) chain on human chr6_hla_hap1
chr6_hla_hap1_chainRn3 - Summary info about chain of rat (rn3) alignments on human chr6_hla_hap1
chr6_hla_hap1_chainRn3 - Alignment block in rat (rn3) chain on human chr6_hla_hap1
chr6_hla_hap1_est - EST alignments on human chr6_hla_hap1
chr6_hla_hap1_gap - Gap locations and types on human chr6_hla_hap1
chr6_hla_hap1_gl - Golden path positions of all clone fragments on human chr6_hla_hap1
chr6_hla_hap1_gold - Instructions on creating golden path from fragments on human chr6_hla_hap1
chr6_hla_hap1_rmsk - Repeating elements created using RepeatMasker <>
chr6_hla_hap2_chainCanFam1 - Summary info about chain of dog (canFam1) alignments on human chr6_hla_hap2
chr6_hla_hap2_chainCanFam1Link - Alignment block in dog (canFam1) chain on human chr6_hla_hap2
chr6_hla_hap2_chainDanRer1 - Summary info about chain of zebrafish (danRer1) alignments on human chr6_hla_hap2
chr6_hla_hap2_chainDanRer1Link - Alignment block in zebrafish (danRer1) chain on human chr6_hla_hap2
chr6_hla_hap2_chainGalGal2 - Summary info about chain of chicken (galGal2) alignments on human chr6_hla_hap2
chr6_hla_hap2_chainGalGal2Link - Alignment block in chicken (galGal2) chain on human chr6_hla_hap2
chr6_hla_hap2_chainMm5 - Summary info about chain of mouse (mm5) alignments on human chr6_hla_hap2
chr6_hla_hap2_chainMm5 - Alignment block in mouse (mm5) chain on human chr6_hla_hap2
chr6_hla_hap2_chainPanTro1 - Summary info about chain of chimp (panTro1) alignments on human chr6_hla_hap2
chr6_hla_hap2_chainPanTro1Link - Alignment block in chimp (panTro1) chain on human chr6_hla_hap2
chr6_hla_hap2_chainRn3 - Summary info about chain of rat (rn3) alignments on human chr6_hla_hap2
chr6_hla_hap2_chainRn3 - Alignment block in rat (rn3) chain on human chr6_hla_hap2
chr6_hla_hap2_est - EST alignments on human chr6_hla_hap2
chr6_hla_hap2_gap - Gap locations and types on human chr6_hla_hap2
chr6_hla_hap2_gl - Golden path positions of all clone fragments on human chr6_hla_hap2
chr6_hla_hap2_gold - Instructions on creating golden path from fragments on human chr6_hla_hap2
chr6_hla_hap2_rmsk - Repeating elements created using RepeatMasker <>
chrN_blastzBestMouse - Blastz alignments of mouse vs. human, filtered to retain only the best match for a given region of the human genome (Dec 2001 and later)
chrN_blastzCb1 - Blastz alignments of May 2003 C. elegans (ce1) vs. Jul 2002 C. briggsae (cb1)
chrN_blastzCe1 - Blastz alignments of Jul 2002 C. briggsae (cb1) vs. May 2003 C. elegans (ce1)
chrN_blastzCe2 - Blastz alignments of C. briggsae (cb1) vs. C. elegans (ce2)
chrN_blastzMm2 - Blastz alignments of Feb. 2002 mouse (mm2) vs. human
chrN_blastzMm3 - Blastz alignments of Feb. 2003 mouse (mm3) vs. human (Dec 2001 and later)
chrN_blastzSelf - Blastz alignments of a genome against itself
chrN_blastzTightMm3 - Blastz alignments of mouse (mm3) vs. human, filtered to retain only the best match for a given region of the human genome, and further filtered to high-scoring matches
chrN_blastzTightMm4 - Blastz alignments of mouse (mm4) vs. human, filtered to retain only the best match for a given region of the human genome, and further filtered to high-scoring matches
chrN_blastzTightMouse - Blastz alignments of mouse vs. human, filtered to retain only the best match for a given region of the human genome, and further filtered to high-scoring matches (June 2002)
chrN_blatFish - Translated BLAT alignments of Tetraodon nigrovirisi against the current genome
chrN_blatFr1 - Translated BLAT alignments of Takifugu rubripes assembly fr1 against the current genome
chrN_blatFugu - Translated BLAT alignments of Takifugu rubripes against the current genome
chrN_blatHg16 - Translated BLAT alignments of human genome (hg16) vs. current genome
chrN_blatHuman - Translated BLAT alignments of human genome vs. mouse genome
chrN_blatMouse - Mouse whole genome shotgun alignments (Aug 2001 and earlier)
chrN_blatMus - Translated BLAT mouse alignments. (Dec 2001 and later)
chrN_cb1Chain - Summary info about chain of C. briggsae (cb1) alignments
chrN_cb1ChainLink - Alignment block in C. briggsae (cb1) chain
chrN_ce1Chain - Summary info about chain of C. elegans (ce1 assembly) alignments
chrN_ce1ChainLink - Alignment block in C. elegans (ce1 assembly) chain
chrN_ce2Chain - Summary info about chain of C. elegans (ce2 assembly) alignments
chrN_chainAnoGam1 - Summary info about chain of A. gambiae (anoGam1 assembly) alignments
chrN_chainCanFam1Link - Alignment block in A. gambiae (anoGam1 assembly) chain
chrN_chainCanFam1 - Summary info about chain of dog (canFam1 assembly) alignments
chrN_chainCanFam1Link - Alignment block in dog (canFam1 assembly) chain
chrN_chainCb1 - Summary info about chain of C. briggsae (cb1 assembly) alignments
chrN_chainCb1Link - Alignment block in C. briggsae (cb1 assembly) chain
chrN_chainCe2Link - Alignment block in C. elegans (ce2 assembly) chain
chrN_chainDanRer1 - Summary info about chain of zebrafish (danRer1 assembly) alignments
chrN_chainDanRer1Link - Alignment block in zebrafish (danRer1 assembly) chain
chrN_chainDm1 - Summary info about chain of D. melanogaster (dm1 assembly) alignments
chrN_chainDm1Link - Alignment block in D. melanogaster (dm1 assembly) chain
chrN_chainDp1 - Summary info about chain of D. pseudoobscura (dp1 assembly) alignments
chrN_chainDp1Link - Alignment block in D. pseudoobscura (dp1 assembly) chain
chrN_chainDp2 - Summary info about chain of D. pseudoobscura (dp2 assembly) alignments
chrN_chainDp2Link - Alignment block in D. pseudoobscura (dp2 assembly) chain
chrN_chainDroYak1 - Summary info about chain of D. yakuba (droYak1 assembly) alignments
chrN_chainDroYak1 - Alignment block in D. yakuba (droYak1 assembly) chain
chrN_chainFr1 - Summary info about chain of Fugu (fr1 assembly) alignments
chrN_chainFr1Link - Alignment block in Fugu chain
chrN_chainGalGal2 - Summary info about chain of chicken (galGal2 assembly) alignments
chrN_chainGalGal2Link - Alignment block in chicken (galGal2 assembly) chain
chrN_chainHg16 - Summary info about chain of human (hg16 assembly) alignments
chrN_chainHg16Link - Alignment block in human (hg16 assembly) chain
chrN_chainHg17 - Summary info about chain of human (hg17 assembly) alignments
chrN_chainHg17Link - Alignment block in human (hg17 assembly) chain
chrN_chainMm3 - Summary info about chain of mouse (mm3 assembly) alignments
chrN_chainMm3Link - Alignment block in mouse (mm3 assembly) chain
chrN_chainMm4 - Summary info about chain of mouse (mm4 assembly) alignments
chrN_chainMm4Link - Alignment block in mouse (mm4 assembly) chain
chrN_chainMm5 - Summary info about chain of mouse (mm5 assembly) alignments
chrN_chainMm5Link - Alignment block in mouse (mm5 assembly) chain
chrN_chainMonDom1 - Summary info about chain of opossum (monDom1 assembly) alignments
chrN_chainMonDom1Link - Summary info about chain of opossum (monDom1 assembly) alignments
chrN_chainPanTro1 - Summary info about chain of chimp (panTro1 assembly) alignments
chrN_chainPanTro1Link - Summary info about chain of chimp (panTro1 assembly) alignments
chrN_chainPt0 - Summary info about chain of chimp (13 Nov 2003 assembly) alignments
chrN_chainPt0Link - Alignment block in chimp (13 Nov 2003 assembly) chain monDommonDom1>chrN_chainRn3 - Summary info about chain of rat (rn3 assembly) alignments
chrN_chainRn3Link - Alignment block in Rat (rn3 assembly) chain
chrN_chainSelf - Summary info about chain of self alignments
chrN_chainSelfLink - Alignment block in self alignment chain
chrN_chainTetNig1 - Summary info about chain of Tetraodon (tetNig1 assembly) alignments
chrN_chainTetNig1Link - Alignment block in Tetraodon (tetNig1 assembly) chain
chrN_chainXenTro1 - Summary info about chain of X. tropicalis (xenTro1 assembly) alignments
chrN_chainXenTro1Link - Alignment block in X. tropicalis (xenTro1 assembly) chain
chrN_contigs_gap - Gap locations and types
chrN_contigs_gold - Instructions on creating goldenPath from fragments
chrN_est - EST alignments
chrN_gap - Gap locations and types
chrN_gl - Golden path positions of all clone fragments
chrN_gold - Instructions on creating golden path from fragments
chrN_humMusL - Human/Mouse Evolutionary Conservation Scores
chrN_intronEst - EST alignments in introns
chrN_mrna - mRNA alignments
chrN_musHumL - Mouse/Human Evolutionary Conservation Scores
chrN_rBestChainPanTro1 - Reciprocal best chain alignments of the panTro1 chimp assembly to the human genome
chrN_rmsk - Repeating elements created using RepeatMasker
chrN_viralProt - Alignments between SwissProt viral proteins and the SARS assembly
chrN_wabaCbr - C. briggsae WABA alignments - abbreviated description
chrN_zoom1_humMusL - Human/Mouse Evolutionary Conservation Scores (very large scale)
chrN_zoom1_hg15Mm3L - Human/Mouse Evolutionary Conservation Scores (hg15/mm3) (very large scale)
chrN_zoom2500_hg15Mm3L - Human/Mouse Evolutionary Conservation Scores (hg15/mm3) (medium scale)
chrN_zoom2500_humMusL - Human/Mouse Evolutionary Conservation Scores (medium scale)
chrN_zoom50_hg15Mm3L - Human/Mouse Evolutionary Conservation Scores (hg15/mm3) (large scale)
chrN_zoom50_humMusL - Human/Mouse Evolutionary Conservation Scores (large scale)



14.3. Datos Almacenados En Una sola Tabla.




The tables in this section contain data stored in a single table rather than in one table per chromosome.
[A] [B] [C] [D] [E] [F] [G] [H] [I] [J] [K] [M] [N] [O] [P] [Q] [R] [S] [T] [U] [V] [W] [X] [Y] [Z]
a_gambiae_myp2a - Pairwise MAF alignment of A. gambiae to D. melanogaster
acembly - Acembly Gene Predictions With Alt-splicing
acemblyPep - Translations of Acembly gene predictions into corresponding amino acid sequences
affy10K - SNPs on the Affymetrix 10K SNP Genotyping Array
affy10KDetails - Affymetrix 10K SNP sequence details
affyZebrafish - Sequences used for probe selection on Affymetrix zebrafish chip
affyExps - Experiment descriptive data
affyGeno - SNPs on the Affymetrix 120K SNP Genotyping Array
affyGenoDetails - Affymetrix 120K SNP array information
affyGn1h - Sequences used for probe selection on Affy GNF1H chips
affyGnf1m - Sequences used for probe selection on Affy GNF1M chips
affyGnfU74A - Sequences used for probe selection on Affy GNFU74A chips
affyGnfU74B - Sequences used for probe selection on Affy GNFU74B chips
affyGnfU74C - Sequences used for probe selection on Affy GNFU74C chips
affyMOE430 - Sequences used for probe selection on Affy MOE430 chips
affyRAE230 - Sequences used for probe selection on Affy RAE230 chips
affyU34A - Sequences used for probe selection on Affy U34A chips
affyU74 - Sequences used for probe selection on Affy U74 chips
affyRatio - Expression data from GNF using Affymetrix GeneChips
affyTranscriptome - Transcriptome data for chr21 and chr22 from Affymetrix
affyU133 - Consensus and exemplar sequences used for probe selection on Affy HG-U133A and HG-U133B chips
affyU133Plus2 - Consensus and exemplar sequences used for probe selection on the Affy HG-U133 Plus 2.0 chip
affyU95 - Consensus and exemplar sequences used for probe selection on Affy HG-U95Av2 chip
affyZebrafish - Consensus and exemplar sequences used for probe selection on Affy Zebrafish chip
all_bacends - BLAT alignment information for BAC clone end sequences on the draft assembly sequence
all_est - EST alignments (concatenation of chr*_est)
all_fosends - Fosmid end alignments
all_mrna - mRNA alignments (concatenation of chr*_mrna)
all_sts_primer - BLAT alignment information for STS markers using primer sequences on the draft sequence assembly
all_sts_seq - BLAT alignment information for full STS markers sequences on the draft sequence assembly
altGraphX - Summary of alt-splicing in EST and mRNA tracks
anoGam1_050201 - Scored reference file for anoGam1 alignments
anophelesEcores - D. melanogaster (dm1)/A. gambiae evolutionary conserved regions (ecores) computed by Exofish
apiMel1_050201 - Scored reference file for apiMel1 alignments
arbFlyLifeAll - Expression data
arbFlyLifeAllExps - Experiment descriptive data
arbFlyLifeAllRatio - Expression data
arbFlyLifeMedian - Expression data
arbFlyLifeMedianExps - Experiment descriptive data
arbFlyLifeMedianRatio - Expression data
atlasOncoGene - Link to Atlas Oncology site
axtNetCb1 - Scored reference file for C. elegans/C. briggsae alignments
axtNetDp1 - Scored reference file for D. melanogaster/D. pseudoobscura alignments
axtNetHg16 - Scored reference file for human/chimp alignments
bacEndPairs - Locations of BAC clones using placements of its 5' and 3' end sequences. BAC end sequence information comes from the dbGSS portion of GenBank
bacEndSingles - Locations of BAC clones where only one end is mapped (Zebrafish)
bactigPos - Bactig positions in chromosome coordinates
bdgpBlastTab - Blastp results of known genes vs. one another (D. melanogaster)
bdgpCanonical - Describes the canonical splice variant of a gene (Drosophila)
bdgpGene - Berkeley Drosophila Genome Project genes (D. melanogaster)
bdgpNonCoding - Berkeley Drosophila Genome Project non-coding genes (D. melanogaster)
bdgpIsoforms - Links together various transcripts of a gene into a cluster (Drosophila)
bdgpToLocusLink - Associates known gene and LocusLink accession (Drosophila)
bdgpToPfam - Associates known gene and Pfam ID (Drosophila)
bdgpToRefSeq - Associates known gene and RefSeq accession (Drosophila)
bgiCov - Areas of chicken genomic coverage of 3 alternate chicken strains sequenced by Beijing Genomics Institute
bgiGene - Alignments of chicken protein-coding genes annotated by Beijing Genomics Institute
bgiSnp - Chicken SNP information from Beijing Genomics Institute
bioCycMapDesc - BioCyc pathway maps
bioCycPathway - Cross reference between BioCyc Pathway and Known Genes
blastDm1FB - tBLASTn alignments of peptides from D. melanogaster predicted and known genes in FlyBase
blastHg16KG - tBLASTn alignments of peptides from hg16 knownGene predicted and known genes
blastHg17KG - tBLASTn alignment of peptides from hg17 knownGene predicted and known genes
blastKGPep0* - tBLASTn alignments peptide sequences
blastKGRef0* - Associates a known gene ID with a gene name, position, and SwissProt name for tBLASTn protein tracks
blatChimp - Blat alignments of Pan troglodytes against the draft human genome
blatCioSav1 - Blat alignments of Ciona savignyi against the current genome
blatFr1 - Translated BLAT alignments of Takifugu rubripes assembly fr1 against the current genome
ceBlastTab - Blastp results of known genes vs. one another (C. elegans)
celeraCoverage - Summary of large genomic duplications from Celera data
celeraDupPositive - Summary of large genomic duplications from Celera data
celeraOverlay - Celera assembly overlay in the public NCBI assembly
cgapAlias - Associates CGAP pathway IDs with gene symbols or mRNA accessions
cgapBiocDesc - CGAP/BioCarta pathway description
cgapBiocPathway - Associates CGAP pathway IDs with BioCarta pathway IDs
chainLink - Alignment block in chain
chainRxBestPt0 - Summary info about a chain of chimp alignments
chainRxBestPt0Link - Alignment block in chimp chain
chicken_hmrg - Chicken scored reference file for human/chimp/mouse/rat/chicken alignments
chicken_netBlastz - Scored reference file for chicken alignments
chimpBac - Blat alignments of Pan troglodytes BACs against the draft human genome
chimpBlat - Blat alignments of Pan troglodytes against the draft human genome
chimpDels - Human genome assembly regions deleted in chimp
chimp_hmrg - Chimp scored reference file for human/chimp/mouse/rat/chicken alignments
chimp_netBlastz - Scored reference file for chimp alignments
chimpSimpleDiff - Simple differences between the chimp and human genome assemblies
choExpDistance - Distance between 2 genes in expression space (S. cerevisiae)
chromInfo - Describes name and size of each chromosome as well as an external file containing the chromosome
clonePos - Positions of all clones in golden path. Also HTG phase, finished/draft/predraft stage, and sequence size
contamination - Contamination information for current assembly
contigAcc - Maps a contig to its accession
cpgIsland - CpG islands
cpgIslandExt - CpG islands including observed/expected ratio
ctgPos - Name, size, and golden path position of all contigs
ctgPos2 - Name, size, golden path position and type of all contigs
cytoBand - 800 chromosome bands mapped to golden path by Terry Furey using fish data from BAC Resource Consortium
cytokines - Cytokine gene annotations (Tetraodon) fish data from BAC Resource Consortium
cytoBandIdeo - Information for mapping ideogram
d_pseudoobscura_myp2a - Pairwise MAF alignment of D. pseudoobscura to D. melanogaster
d_yakuba_myp2a - Pairwise MAF alignment of D. yakuba to D. melanogaster
danRer1_netBlastz - Scored reference file for zebrafish (danRer1) alignments
danRer2_netBlastz - Scored reference file for zebrafish (danRer2) alignments
dbSnpRS - Information from dbSNP at the reference SNP level
dbSnpRsHg - Human genome information from dbSNP at the reference SNP level
dbSnpRsMm - Mouse genome information from dbSNP at the reference SNP level
dbSnpRsRn - Rat genome information from dbSNP at the reference SNP level
dbtssAli - RefSeq mRNA extended to the 5' end from DBTSS (Database of Transcriptional Start Sites)
dmBlastTab - Blastp results of known genes vs. one another (D. melanogastor)
dog_netBlastz - Scored reference file for dog alignments
dp2_050201 - Scored reference file for dp2 alignments
drBlastTab - Blastp results of known genes vs. one another (Danio rerio)
droAna1_050201 - Scored reference file for droAna1 alignments
droMoj1_050201 - Scored reference file for droMoj1 alignments
droVir1_050201 - Scored reference file for droVir1 alignments
droYak1_050201 - Scored reference file for droYak1 alignments
dupSpMrna - Duplicate mRNA/Protein entries that have identical CDS structures
ECgene - ECGene gene predictions
ECgenePep - Translations of ECgene genes into corresponding amino acid sequences
ecoresFr1 - Human/Fugu evolutionary conserved regions (ecores) computed by Exofish
ecoresHg16 - Human (hg16)/Fugu evolutionary conserved regions (ecores) computed by Exofish
ecoresHg17 - Human (hg17)/Fugu evolutionary conserved regions (ecores) computed by Exofish
ecoresMm3 - Mouse (mm3)/Fugu evolutionary conserved regions (ecores) computed by Exofish
ecoresRn3 - Rat (rn3)/Fugu evolutionary conserved regions (ecores) computed by Exofish
ecoresTetNig1 - Tetraodon (tetNig1)/Human evolutionary conserved regions (ecores) computed by Exofish
ecoresTetraodon - Tetraodon/Human evolutionary conserved regions (ecores) computed by Exofish
encodeAffyChIpRnapHl50PvalHr[00,02,08,32] - Affymetrix ChIP/Chip enrichment of Pol2 from retinoic acid stimulated HL60 cells at 0, 2, 8, or 32 hours, in ENCODE regions (4 different tracks)
encodeAffyChIpRnapHl60SitesHr[00,02,08,32] - Affymetrix ChIP/Chip of Pol2 from retinoic acid stimulated HL60 cells at 0, 2, 8, or 32 hours, in ENCODE regions (4 different tracks)
encodeAffyRnaHl60SigHr[00,02,08,32] - Affymetrix PolyA+ RNA from retinoic acid stimulated HL60 cells at 0, 2, 8, or 32 hours, in ENCODE regions (4 different tracks)
encodeAffyRnaHl60SitesHr[00,02,08,32] - Affymetrix PolyA+ RNA abundance from retinoic acid stimulated HL60 cells at 0, 2, 8, or 32 hours, in ENCODE regions (4 different tracks)
encodeRegionInfo - Descriptive, assembly-independent information about ENCODE regions
encodeRegions - Names and positions of selected regions for the ENCODE project
encode_NHGRI_DNAseHS - DNaseI-hypersensitive sites in ENCODE regions
encode_Stanford_Promoters - Activity levels of predicted promoters in ENCODE regions (Stanford)
encode_UCSD_ChIP_RNAP_HCT116 - ChIP/Chip (Pol II HCT116) in ENCODE regions (UCSD)
encode_UCSD_ChIP_RNAP_HELA - ChIP/Chip (Pol II HeLa) in ENCODE regions (UCSD)
encode_UCSD_ChIP_RNAP_IMR90 - ChIP/Chip (Pol II IMR90) in ENCODE regions (UCSD)
encode_UCSD_ChIP_RNAP_THP1 - ChIP/Chip (Pol II THP1) in ENCODE regions (UCSD)
encode_UCSD_ChIP_TAF250_HCT116 - ChIP/Chip (TAF1 HCT116) in ENCODE regions (UCSD)
encode_UCSD_ChIP_TAF250_HELA - ChIP/Chip (TAF1 HeLa) in ENCODE regions (UCSD)
encode_UCSD_ChIP_TAF250_IMR90 - ChIP/Chip (TAF1 IMR90) in ENCODE regions (UCSD)
encode_UCSD_ChIP_TAF250_THP1 - ChIP/Chip (TAF1 THP1) in ENCODE regions (UCSD)
encode_UVA_DNARep_0_2 - Temporal profiling of DNA replication (0-2 hrs) in ENCODE regions (U. VA)
encode_UVA_DNARep_2_4 - Temporal profiling of DNA replication (2-4 hrs) in ENCODE regions (U. VA)
encode_UVA_DNARep_4_6 - Temporal profiling of DNA replication (4-6 hrs) in ENCODE regions (U. VA)
encode_UVA_DNARep_6_8 - Temporal profiling of DNA replication (6-8 hrs) in ENCODE regions (U. VA)
encode_UVA_DNARep_8_10 - Temporal profiling of DNA replication (8-10 hrs) in ENCODE regions (U. VA)
ensEstGene - Cross-reference info between transcript entries and translation entries of Ensembl genes
ensemblXref2 - Cross-reference info between transcript entries and translation entries of Ensembl genes (alternative table used in some assemblies)
ensemblXref3 - Cross-reference info between transcript entries and translation entries of Ensembl genes (alternative table used in some assemblies)
ensEst - Ensembl gene predictions based on ESTs
ensEstGene - Ensembl gene predictions based on ESTS
ensEstGtp - Associates Ensembl gene, transcript, and protein IDs
ensEstPep - Translations of Ensembl EST-based gene predictions into corresponding amino acid sequences
ensGene - Ensembl Gene Predictions
ensGeneXref - Table gene_xref downloaded from Ensembl
ensGtp - Associates Ensembl gene, transcript, and protein IDs
ensPep - Translations of Ensembl gene predictions into corresponding amino acid sequences
ensTranscript - Table transcript downloaded from Ensembl
esRegGeneToMotif - Eran Segal regulatory module predicted trancription factor binding sites
estOrientInfo - Extra information on ESTs calculated by polyInfo program
exoFish - Genescope Exofish Tetraodon evolutionarily conserved regions (Last used Aug. 2001)
exoMouse - Exonerate mouse/human evolutionarily conserved regions (Last used Apr. 2001)
exoniphy - Evolutionarily conserved protein-coding exons in multiple, aligned sequences identified by the ExoniPhy program
fbAllele - Alleles of a FlyBase gene
fbGene - Links FlyBase IDs, gene symbols and gene names
fbGo - Links FlyBase gene IDs and GO IDs/aspects
fbPhenotype - FlyBase observed phenotype in mutant
fbRef - FlyBase literature or database reference
fbRole - FlyBase role of gene in wildType
fbSynonym - Links FlyBase ID to gene synonyms in database
fbTranscript - Links FlyBase gene IDs and BDGP transcript IDs
flyBase2004Xref - Cross reference of FlyBase gene ID, symbolic gene name, synonyms, and accessions (circa late 2004)
flyBaseGene - FlyBase gene predictions
flyBasePep - FlyBase genes translated proteins
flyBaseNoncoding - FlyBase genes noncoding RNAs
flyBaseSwissProt - FlyBase acc to SwissProt acc, plus some other SwissProt info
flyreg - FlyReg data (D. melanogaster - dm1)
flyreg2 - FlyReg data (D. melanogaster - dm2)
flyregMotif - FlyReg gapless motif (D. melanogaster)
firstEF - First Exon Finder (FirstEF) exon and promoter predictions
fishClones - Clones placed on Cytogenetic Map using FISH
foldUtr3 - Info about folding of RNA into secondary structure
foldUtr5 - Info about folding of RNA into secondary structure
fosEndPairs - Positions of end pairs for fosmids
fugu_netBlastz - Scored reference file for Fugu alignments
galGal2_netBlastz - Scored reference file for chicken alignments
gaze - Genoscope GAZE gene annotations (Tetraodon)
gbProtAnn - GenBank protein annotations
gc5Base - Percentage of G or C bases in a 5-base window
gcPercent - Percentage of G or C bases in a 20,000-base window
geneBands - Band locations of known genes
geneid - Gene predictions from the geneid program
geneidPep - Translations of geneid gene predictions into its corresponding amino acid sequence
genieAlt - Genie gene predictions - all constrained by one degree or another by EST or mRNA
genieAltPep - Translations of Genie gene predictions into its corresponding amino acid sequence
genieKnown - Known genes processed by Genie to allow sequencing error (Oct. 2000 and earlier known gene track)
genieKnownPep - Translations of known genes into its corresponding amino acid sequence (Oct. 2000 and earlier known gene track)
genMapDb - BAC clones from GenMapDB placed on the assembly by U Penn (V. Cheung)
genomicSuperDups - Duplications of >1000 Bases Sequence
genscan - Genscan Gene Predictions
genscanPep - Translations of Genscan gene predictions into corresponding amino acid sequences
genscanSubopt - Genscan byproducts: good individual exons out of frame with main predictions (Last used Apr. 2001)
gnfAtlas2 - Expression data from the GNF Gene Expression Atlas 2
gnfAtlas2Distance - Describes the distance between genes in the expression space (GNF Atlas 2)
gnfHumanAtlas2All - Expression data
gnfHumanAtlas2AllExps - Experiment descriptive data
gnfHumanAtlas2AllRatio - Expression data
gnfHumanAtlas2Median - Expression data
gnfHumanAtlas2MedianExps - Experiment descriptive data
gnfHumanAtlas2MedianRatio - Expression data
gnfHumanU95All - Expression data
gnfHumanU95AllExps - Experiment descriptive data
gnfHumanU95AllRatio - Expression data
gnfHumanU95Median - Expression data
gnfHumanU95MedianExps - Experiment descriptive data
gnfHumanU95MedianRatio - Expression data
gnfMouseAtlas2All - Expression data
gnfMouseAtlas2AllExps - Experiment descriptive data
gnfMouseAtlas2AllRatio - Expression data
gnfMouseAtlas2Median - Expression data
gnfMouseAtlas2MedianExps - Experiment descriptive data
gnfMouseAtlas2MedianRatio - Expression data
gnfMouseU74aAll - Expression data
gnfMouseU74aAllExps - Experiment descriptive data
gnfMouseU74aAllRatio - Expression data
gnfMouseU74aMedian - Expression data
gnfMouseU74aMedianExps - Experiment descriptive data
gnfMouseU74aMedianRatio - Expression data
gnfMouseU74bAll - Expression data
gnfMouseU74bAllExps - Experiment descriptive data
gnfMouseU74bAllRatio - Expression data
gnfMouseU74bMedian - Expression data
gnfMouseU74bMedianExps - Experiment descriptive data
gnfMouseU74bMedianRatio - Expression data
gnfMouseU74cAll - Expression data
gnfMouseU74cAllExps - Experiment descriptive data
gnfMouseU74cAllRatio - Expression data
gnfMouseU74cMedian - Expression data
gnfMouseU74cMedianExps - Experiment descriptive data
gnfMouseU74cMedianRatio - Expression data
gnfRatAtlas2All - Expression data
gnfRatAtlas2AllExps - Experiment descriptive data
gnfRatAtlas2AllRatio - Expression data
gnfRatAtlas2Median - Expression data
gnfRatAtlas2MedianExps - Experiment descriptive data
gnfRatAtlas2MedianRatio - Expression data
gnfU95Distance - Describes the distance between genes in the expression space (GNF U95)
HInv - Full-length cDNAs from the H-Invitational Human Gene Annotation Database
HInvGeneMrna - H-Invitational genes mRNA data
haplotype - Common Haplotype Blocks - U. of Oxford and Sanger Institute (chr22 only)
hg17_netBlastz - Scored reference file for human hg17 alignments
hgFindSpec - Information that defines a search performed by hgFind binary
hoxGenes - HOX gene mRNAs
hugo - Cross reference between hugo and other databases
humanChain - Summary info about chain of human alignments
human_chm - Pairwise multiple alignments between current species and human
humanDels - Human deletions in chimp genome
humanNet - Database representation of a net of alignments with human
humorMm3Rn3 - Human, Mouse, and Rat multiz alignments for hg16, mm3, and rn3 (human only)
imageClone - Used with image consortium's cumulative_plate files at: ftp://image.llnl.gov/image/outgoing"
interProXref - Associates InterPro ID with Swiss-Prot accessions
jaxOrtholog - Jackson Labs Mouse Orthologs
jaxQTL - Jackson Labs Mouse Quantitative Trait Loci
jgiGene - Alignments of JGI predicted transcripts to the current genome
keggMapDesc - Description of KEGG pathway map
keggPathway - Associates KEGG pathway IDs with Known Genes and LocusLink IDs
kgAlias - Links together a Known Gene ID and a gene alias
kgProtAlias - Links together a Known Gene ID and a protein alias
kgProtMap - Known Genes protein mapping
kgSpAlias - Links together a Known Gene ID, Swiss-Prot/TrEMBL accession and an alias
kgXref - Links together a Known Gene ID and mRNA, SwissProt, RefSeq, and NCBI accessions/IDs
kimWormLifeAllExps - Experiment descriptive data
kimWormLifeAllRatio - Expression data
kimWormLifeMedianExps - Experiment descriptive data
kimWormLifeMedianRatio - Expression data
knownBlastTab - Blastp results of known genes vs. one another (human)
knownCanonical - Describes the canonical splice variant of a gene
knownExpDistance - Describes the distance between genes in the expression space (UCLA)
knownGene - Protein coding genes based on proteins from SWISS-PROT, TrEMBL, and TrEMBL-NEW and their corresponding mRNAs from GenBank
knownGeneLink - Stores the seqType info for Known Genes track entries.
knownGeneMrna - Known Genes mRNA
knownGenePep - Known Genes translated proteins
knownInfo - Other information about known genes (Oct. 2000 and earlier known gene track)
knownIsoforms - Links together various transcripts of a gene into a cluster
knownMore - Links to other databases: GenBank, OMIN, HUGO, RefSeq, GBD (Oct. 2000 and earlier known (RefSeq) gene track)
knownToCdsSnp - Associates known gene and coding SNP IDs
knownToEnsembl - Associates known gene and Ensembl transcripts
knownToGnfAtlas2 - Associates known gene and Atlas2 expression data
knownToGnf1h - Associates known gene and GNF1H expression data
knownToHInv - Associates known gene and HInv transcripts
knownToLocusLink - Associates known gene and LocusLink ID
knownToMOE430 - Associates known gene and Affy MOE430 expression data
knownToMOE430A - Associates known gene and Affy MOE430A expression data
knownToPfam - Associates known gene and Pfam ID
knownToRefSeq - Associates known gene and RefSeq accession
knownToSuper - Associates known gene and Superfamily ID
knownToU133 - Associates known gene and Affy U133 chip ID
knownToU133Plus2 - Associates known gene and Affy U133 Plus 2.0 chip ID
knownToU133 - Associates known gene and Affy U133 chip ID
knownToU74 - Associates known gene and Affy U74 (mouse) chip ID
knownToU95 - Associates known gene and Affy U95 chip ID
mgcFullMrna - Mammalian Gene Collection (MGC) full ORF mRNAs
mgcFullStatus - Status of MGC clones
mgcGenes - MGC full ORF mRNAs
MGI ID - Links MGI ID to Locus Link ID (Mouse)
miRNA - MicroRNAs from the miRNA Registry at the WellCome Trust Sanger Institute.
mm5_netBlastz - Scored reference file for mouse mm5 alignments
mmBlastTab - Blastp results of known genes vs. one another (mouse)
mostConserved - BED files of most conserved data.
mouseChain - Summary info about chain of mouse alignments
mouse_chm - Pairwise multiple alignments between current species and mouse
mouseChrom - Describes name and size of each mouse chromosome as well as an external file containing the chromosome
mouse_hmrg - Mouse scored reference file for human/chimp/mouse/rat/chicken alignments
mouseNet - Database representation of a net of alignments with mouse
mouse_netBlastz - Scored reference file for mouse alignments
mouseRinnSex - Rinn et al. sex gene expression data on MOE430A chip
mouseRinnSexExps - Rinn et al. sex gene experiment descriptive data on MOE430A chip
mouseRinnSexMedian - Rinn et al. sex gene expression data on MOE430A chip
mouseRinnSexMedianExps - Rinn et al. sex gene experiment descriptive data on MOE430A chip
mouseRinnSexMedianRatio - Rinn et al. sex gene expression data on MOE430A chip
mouseRinnSexRatio - Rinn et al. sex gene expression data on MOE430A chip
mouseSyn - Synteny between mouse and human chromosomes (Last used Apr. 2001)
mouseSynWhd - Whitehead synteny between mouse and human chromosomes
mrnaOrientInfo - Extra information on mRNAs calcluated by polyInfo program
mrnaRefseq - Associates mRNA IDs with RefSeq IDs
multiz5way - Index of multiz multiple alignments of 5 organisms. NOTE: To obtain the conservation scores associated with this assembly, download the data from the assembly's phastCons directory on the Genome Browser FTP server.
multiz8way - Index of multiz multiple alignments of 8 organisms. NOTE: To obtain the conservation scores associated with this assembly, download the data from the assembly's phastCons directory on the Genome Browser FTP server.
multiz8wayCons - "Wiggle track" display of evolutionary conservation in 8 organisms based on a phylogenetic hidden Markov model, using multiz alignments. NOTE: To obtain the conservation scores associated with this assembly, download the data from the assembly's phastCons directory on the Genome Browser FTP server.
mzPt1Mm3Rn3Gg2_pHMM - Index of multiz multiple alignments of human, chimp, mouse, rat and chicken. NOTE: To obtain the conservation scores associated with this assembly, download the data from the assembly's phastCons directory on the Genome Browser FTP server.
mzPt1Mm3Rn3Gg2_pHMM_wig - "Wiggle track" display of evolutionary conservation in human, chimp, mouse, rat, and chicken based on a phylogenetic hidden Markov model, using multiz alignments. NOTE: To obtain the conservation scores associated with this assembly, download the data from the assembly's phastCons directory on the Genome Browser FTP server.
multizHg15Mm3 - Multiz multiple alignments between human (hg15) and mouse (mm3)
multizMm3Rn2 - Multiz multiple alignments between mouse (mm3) and rat (rn2)
multizYeast - Multiz multiple alignments of 7 yeast species against S. cerevisiae (sc1)
mzDy1Dp2Ag1_phast - Index of multiz multiple alignments of D. melanogaster, D. pseudoobscura, and A. gambiae NOTE: To obtain the conservation scores associated with this assembly, download the data from the assembly's phastCons directory on the Genome Browser FTP server.
mzDy1Dp2Ag1_phast_wig - "Wiggle track" display of evolutionary conservation in D. melanogaster, D. pseudoobscura, and A. gambiae based on a phylogenetic hidden Markov model, using multiz alignments. NOTE: To obtain the conservation scores associated with this assembly, download the data from the assembly's phastCons directory on the Genome Browser FTP server.
mzHg17Mm5_phast - Evolutionary conservation in current species, human, and mouse based on a phylogenetic hidden Markov model, using multiz alignments. NOTE: To obtain the conservation scores associated with this assembly, download the data from the assembly's phastCons directory on the Genome Browser FTP server.
mzPt1Mm3Rn3Gg2_pHMM_wig - "Wiggle track" display of evolutionary conservation in current species, human, and mouse based on a phylogenetic hidden Markov model, using multiz alignments. NOTE: To obtain the conservation scores associated with this assembly, download the data from the assembly's phastCons directory on the Genome Browser FTP server.
nci60 - Microarray Experiments for NCI 60 Cell Lines
nci60Exps - Experiment descriptive data
netAnoGam1 - Database representation of a net of alignments with A. gambiae anoGam1 assembly
netCanFam1 - Database representation of a net of alignments with dog assembly canFam1
netCb1 - Database representation of a net of alignments with C. briggsae assembly cb1
netDanRer1 - Database representation of a net of alignments with zebrafish assembly danRer1
netDanRer2 - Database representation of a net of alignments with zebrafish assembly danRer2
netDm1 - Database representation of a net of alignments with D. melanogaster assembly dm1
netDp1 - Database representation of a net of alignments with D. pseudoobscura assembly dp1
netDp2 - Database representation of a net of alignments with D. pseudoobscura assembly dp2
netDroYak1 - Database representation of a net of alignments with D. yakuba assembly droYak1
netFr1 - Database representation of a net of alignments with Fugu assembly fr1
netHg15 - Database representation of a net of alignments with Huamn assembly hg15
netHg16 - Database representation of a net of alignments with Huamn assembly hg16
netHg17 - Database representation of a net of alignments with Huamn assembly hg17
netGalGal2 - Database representation of a net of alignments with chicken assembly galGal2
netMm3 - Database representation of a net of alignments with mouse assembly mm3
netMm4 - Database representation of a net of alignments with mouse assembly mm4
netMm5 - Database representation of a net of alignments with mouse assembly mm5
netMonDom1 - Database representation of a net of alignments with opossum assembly monDom1
netPanTro1 - Database representation of a net of alignments with chimp assembly panTro1
netRn3 - Database representation of a net of alignments with rat assembly rn3
netRxBestPt0 - Database representation of a net of alignments with chimp assembly pt0
netSelf - Database representation of a net of alignments of assembly with itself
netSyntenyDm1 - Database representation of a net of alignments with D. melanogaster assembly dm1
netSyntenyHg16 - Database representation of a net of alignments with human assembly hg16
netTetNig1 - Database representation of a net of alignments with Tetraodon assembly tetNig1
netXenTro1 - Database representation of a net of alignments with X. tropicalis assembly xenTro1
NIAGene - Alignments of the NIA Mouse Gene Index (v.3) with the selected mouse assembly
otherSARS - Other SARS sequences from NCBI aligned to the SARS assembly
pbAaDistX - Proteome Browser distribution for a specific amino acid X
pbAnomLimit - Proteome Browser amino acid anomaly limits for each AA
pbResAvgStd - Proteome Browser residue average and standard deviation
pbStamp - Proteome Browser stamp information
pdbSP - Links a Swiss-Prot accession ID with a PDB ID
pepCCntDist - Proteome Browser cysteine count distribution
pepExonCntDist - Proteome Browser exon count distribution
pepHydroDist - Proteome Browser hydrophobicity distribution
pepIPCntDist - Proteome Browser InterProt domain count distribution
pepMolWtDist - Proteome Browser molecular weight distribution
pepMwAa - Proteome Browser molecular weight and AA length of proteins
pepPi - Proteome Browser protein pIs
pepPiDist - Proteome Browser pI distribution
pepPred - Proteome Browser predicted peptide linked to predicted gene
pepResDist - Proteome Browser residue distribution
perlegen - Perlegen Common High-Resolution Haplotype Blocks (chr21 only)
pfamDesc - Description of Pfam table
pfamXref - Links Pfam and Swiss-Prot IDs
pGC - Percentage of bases that are G or C in small regions across the genome
phastCons - "Wiggle track" display of evolutionary conservation based on a phylogenetic hidden Markov model, using multiz alignments
phastCons5 - "Wiggle track" display of evolutionary conservation in 4 organisms based on a phylogenetic hidden Markov model, using multiz alignments
phastCons8way - "Wiggle track" display of evolutionary conservation in 8 organisms based on a phylogenetic hidden Markov model, using multiz alignments
phastConsElements - Predictions of conserved elements produced by phastCons program
phastConsElements8way - Predictions of conserved elements in 8 organisms produced by phastCons program
phMouse - Pattern Hunter Mouse/Human Evolutionarily Conserved Regions (Last used Apr. 2001)
pjt_gene - NISC-generated gene annotations for zoo
protHomolog - SAM homolog data
pscreen - P-screen (BDGP Gene Disruption Project) P element insertion locations and genes
pseudoGeneLink - Links between predicted gene/pseudogene and ortholog/paralog information
pseudoMrna - Predicted pseudogene alignment information
pseudoYale - Alignments of pseudogenes identified in the Yale Pseudogene Database
quality - Genome quality scores
rankProp - RankProp protein ranking for a pair of proteins
rat_hmrg - Rat scored reference file for human/chimp/mouse/rat/chicken alignments
rat_netBlastz - Scored reference file for rat alignments
rBestNetPanTro1 - Database representation of a reciprocal best net of alignments with chimp assembly panTro1
recombRate - Describes the recombination rate in 1Mb intervals based on deCODE, Genethon and Marshfield maps
recombRateRat - Describes rat recombination rate based on SHRSPxBN F2 intercross or FHHxACI F2 intercross genetic maps.
refFlat - RefSeq genes, with additional name (as it appears in Genome Browser) field
refGene - RefSeq genes
refKnown - Known genes as derived from alignments of RefSeq mRNA (Dec 2000 and later known (RefSeq) gene track)
refLink - Relates RefSeq mRNA accession to LocusLink ID, HUGO Gene Nomenclature Committee symbol, etc. (Dec. 2000 and later)
refMrna - RefSeq mRNA (Dec. 2000 and later, not present in incrementally-updated assemblies)
refPep - RefSeq translated proteins (Dec. 2000 and later, not present in incrementally-updated assemblies)
refSeqAli - RefSeq translated proteins (Dec. 2001 and later)
refSeqStatus - Associates RefSeq mRNA accessions with corresponding RefSeq status (Dec. 2001 and later)
refSeqSummary - Sparse summary table created only for refSeqs that have "Summary:" or "COMPLETENESS:" in comment
regPotential2X - 2-way regulatory potential score computed from human/mouse alignments
regPotential3X - 3-way regulatory potential score computed from human/mouse/rat alignments
rgdEst - Rat Genome Database ESTs
rgdGene - Rat Genome Database genes
rgdQtl - Rat Genome Database QTLs
rgdSslp - Rat Genome Database simple sequence length polymorphisms (SSLPs)
rhMap - Alignments of radiation hybrid map sequences to the assembly
rikenaltid - Riken altid table (Mouse Feb. 2002 and later)
rikenann - Riken annotation table (Mouse Feb. 2002 and later)
rikencluster - Riken cluster table (Mouse Feb. 2002 and later)
rikenclusterseq - Riken cluster sequence regulation table (Mouse Feb. 2002 and later)
rikenseq - Riken sequence table (Mouse Feb. 2002 and later)
rinnSex - Rinn et al. sex gene expression data on MOE430A chip
rnaCluster - Gene boundaries deduced from clustering spliced ESTs and mRNAs against the genome (Apr. 2002 and later)
rnaGene - Functional RNA genes (Last used Apr. 2001)
rosetta - Rosetta Experimental Confirmation of Chr22 Exons
rosettaExps - Experiment descriptive data
rosettaExps - Rosetta Experimental Confirmation information
sage - Stores SAGE data in terms of UniGene identifiers
sacBay_pwMaf - Scored reference file for S. bayanus alignments
sacCas_pwMaf - Scored reference file for S. castelli alignments
sacKlu_pwMaf - Scored reference file for S. kluyveri alignments
sacKud_pwMaf - Scored reference file for S. kudriavzevii alignments
sacKud_pwMik - Scored reference file for S. mikatae alignments
sacKud_pwPar - Scored reference file for S. paradoxus alignments
sageExp - Data related to SAGE experiments, tissue descriptions, etc.
samSubdir - Associates SAM data subdirectory with Known Gene ID
sanger20 - Sanger Institute Chromosome 20 Genes
sanger20extra - Additional information about a Sanger 20 or 22 gene
sanger22 - Sanger Institute Chromosome 22 Genes
sanger22extra - Additional information about a Sanger 20 or 22 gene
sanger22pep - Translations of Sanger22 gene predictions into corresponding amino acid sequences
sanger22pseudo - Sanger Institute Chromosome 22 Pseudogenes
sangerBlastTab - Blastp results of Sanger genes vs. one another (C. elegans)
sangerCanonical - Describes the canonical splice variant of a Sanger gene (C. elegans)
sangerGene - Sanger gene predictions, containing protein ID (C. elegans)
sangerGenefinder - Sanger gene predictions, containing protein ID (C. elegans)
sangerIsoforms - Links together various transcripts of Sanger gene into a cluster (C. elegans)
sangerToKim - Associates Sanger IDs and Kim Lab expression IDs (which are mostly - but not all - the same) (C. elegans)
sangerToPfam - Associates Sanger IDs and Pfam ID (C. elegans)
sangerToRefSeq - Associates Sanger IDs and RefSeq accession (C. elegans)
scBlastTab - Blastp results of known genes vs. one another (SARS)
scopDes - Structural Classification of Proteins description. See Lo Conte, Brenner et al. NAR 2002"
seq - Locations of database table sequences referenced in external fasta files
sfAssign - Superfamily assignment table
sfDes - Superfamily description table
sfDescription - Stores domain descriptions for the Superfamily track
sgdAbundance - Protein abundance data from http://yeastgfp.ucsf.edu via SGD (S. cerevisiae)
sgdBlastTab - Blastp results of SGD genes vs. one another (S. cerevisiae)
sgdCanonical - Describes the canonical splice variant of a gene (S. cerevisiae)
sgdClone - Clone information from the Saccharomyces Genome Database (S. cerevisiae)
sgdGene - Saccharomyces Genome Database gene predictions (S. cerevisiae)
sgdIsoforms - Links together various transcripts of a gene into a cluster (S. cerevisiae)
sgdLocalization - Associates known gene and SGD accession (S. cerevisiae)
sgdOther - Other features from Saccharomyces Genome Database (S. cerevisiae)
sgdOtherDescription - More features from Saccharomyces Genome Database (S. cerevisiae)
sgdPep - Translations of SGD gene predictions into corresponding amino acid sequences (S. cerevisiae)
sgdToName - Associates SGD gene name and mRNA (S. cerevisiae)
sgdToPfam - Associates SGD ID and Pfam ID (S. cerevisiae)
sgdToSgd - Associates SGD IDs (S. cerevisiae)
sgdToSwissProt - Associates SGD IDs and Swiss-Prot IDs (S. cerevisiae)
sgpGene - SGP gene predictions (GRIB)
sgpPep - Translations of SGP gene predictions into corresponding amino acid sequences
simpleRepeat - Simple tandem repeats generated with the TRF program
slamHuman - Slam predictions of coding exons in homologous DNA sequences (human genome)
slamHumanNonCoding - Slam predictions of conserved noncoding regions in homologous DNA sequences (human genome)
slamMouse - Slam predictions of coding exons in homologous DNA sequences (mouse genome)
slamMouseNonCoding - Slam predictions of conserved noncoding regions in homologous DNA sequences (mouse genome)
slamRat - Slam predictions of coding exons in homologous DNA sequences (rat genome)
slamRatNonCoding - Slam predictions of conserved noncoding regions in homologous DNA sequences (rat genome)
snapGene - Alignments of SNAP genes (Semi-HMM-based Nucleic Acid Parser) against the current genome
snp - SNP positions from various sources (hg17 human assemblies and later)
snpExceptions - Contains a set of queries to look for potentially problematic SNPs
snpMap - SNP positions from various sources (hg13, hg15, and hg16 human assemblies)
snpNih - Locations of SNPs detected by aligning reads from random genomic clones against the genome (replaced by snpMap starting with hg13)
snpTsc - Locations of SNPs detected primarily by looking at overlaps between clones that cover the same region (replaced by snpMap starting with hg13)
softberryGene - Fgenesh++ Gene Predictions
softberryHom - String with GenBank gi and accession
softberryPep - Translations of Fgenesh++ gene predictions into corresponding amino acid sequences
spDisease - Associates SwissProt IDs with a disease description
spMrna - Associates SwissProt IDs with mRNA IDs
spOrganism - Associates SwissProt IDs with a taxonomy number
spPsiBlast - PSI-BLAST E-value for 2 proteins
spSecondaryID - Associates SwissProt IDs with secondary accession IDs
spXref2 - Associates SwissProt IDs with other databases
stsAlias - STS marker aliases and associated identification numbers
stsInfo - Constant STS marker information
stsInfo2 - Constant STS marker information - revised version used in later releases
stsInfoMouse - Constant STS marker information (MGI)
stsInfoMouseNew - Constant STS marker information (NCBI)
stsInfoRat - Constant STS marker information - rat assembly
stsMap - STS markers on genetic (blue) and radiation hybrid (black) maps
stsMapMouse - STS markers and postions on mouse assembly (MGI)
stsMapMouseNew - STS markers and postions on mouse assembly (NCBI)
stsMapRat - STS markers and postions on rat assembly
stsMarker - STS marker mappings from various maps and FISH clone mappings from the BAC Resource Consortium (obsolete as of Apr. 2001, replaced by stsMap)
supercontig - Locations of supercontigs from WGS assembly
superfamily - Superfamily proteins
swInterPro - Associates Swiss-Prot accession IDs with InterPro IDs
syntenyHg16 - Human synteny alignnments (hg16)
syntenyHuman - Human synteny alignnments from blastz single coverage
syntenyMm3 - Synteny between mouse (mm3) and human chromosomes
syntenyMouse - Synteny between mouse and human chromosomes (First used in hg13)
syntenyRat - Synteny between rat and human chromosomes (First used in hg13)
tfbsCons - Transcription factor binding sites conserved in a multiple species alignment
tfbsConsMap - Transcription factor binding sites conservation map data
tigrGeneIndex - Alignments of the TIGR Gene Index against the selected genome
tilingPath - A tiling path of clones through a chromosome
transRegCode - Transcription factor binding sites from CHIP/CHIP experiments and conservation
transRegCodeCondition - Associates a transcription factor with a growth condition
transRegCodeMotif - Transcription factor binding motif according to Harbison Gordon et al.
transRegCodeProbe - CHIP/CHIP probe and trranscription factor binding info
twinscan - TwinScan Gene Predictions
twinscanPep - Translations of Twinscan gene predictions into corresponding amino acid sequences
uniGene - UniGene alignments and SAGE Info (Last used Apr. 2001)
uniGene_2 - UniGene alignments and SAGE Info (new version)
uniGene_dr - Zebrafish UniGene alignments
uniGene_gg - Chicken UniGene alignments
vegaGene - Annotated genes from the Vertebrate Genome Annotation (VEGA) database (Human chr14, 20, 22 only)
vegaInfo - Additional information for Vega genes (Human chr14, 20, 22 only)
vegaPep - Translations of Vega genes into corresponding amino acid sequences (Human chr14, 20, 22 only)
vegaPseudoGene - Annotated pseudogenes and immunoglobulin segments from the VEGA database (Human chr14, 20, 22 only)
vntr - Microsatellites from Gerome Breen's VNTR program
wabaCbr - C. briggsae WABA alignments - full description
wgRna - CD and H/ACA Box snoRNAs and microRNAs from Weber and Griffiths-Jones
wz_ests - Alignments of WZ ESTs from WUSTL to the zebrafish assembly
xenoEst - Nonhuman ESTs from GenBank
xenoMrna - Nonhuman mRNAs from GenBank
xenoRefFlat - RefSeq genes from species other than current species, with additional name (as it appears in Genome Browser) field
xenoRefGene - RefSeq genes from species other than current species
xenoRefSeqAli - RefSeq translated proteins for species other than current species
yeastChoCellCycle - Expression data
yeastChoCellCycleExps - Experiment descriptive data
yeastChoCellCycleRatio - Expression data
zebrafish_netBlastz - Scored reference file for zebrafish alignments
zoom1_affyTranscriptome - Affymetrix Transcriptome scores (large scale)
zoom2_affyTranscriptome - Affymetrix Transcriptome scores (medium scale)


14.4. Internal Use Tables



The tables in this section are intended primarily for internal use.
axtInfo - Axt alignment names and sizes
certificate - Table for non-standard join certificates
extFile - References to external files, again only used by RNA.
gbExtFile - References to external GenBank files.
gbLoaded - GenBank incremental update information.
grp - Track group types in browser display window
history - Modification history of database, only used by RNA programs
tableDescriptions - Descriptive information about database tables form autoSQL/gbdDescriptions
trackDb - Describes an annotation track


14.5. mRNA Sequence Tables




The tables in this section contain additional information about mRNA sequences.
author - List of authors
bacClone - Name of the Bacterial Artificial Chromosome clone that a sequence was grown in, if applicable (Last used Aug. 2001)
cds - Coding sequence in GenBank format
cell - Cell types
center - Sequencing center (Last used Aug. 2001)
chromosome - Chromosome ID and name (Last used Aug. 2001)
cytoMap - Position on a cytological map (Last used Aug. 2001)
description - Short (one line) description
development - Stage of development of organism
gbCdnaInfo - Very relational mRNA and EST information table. Consists mostly of the mRNA accession and pointers into other tables that contain additional mRNA information.
geneName - Name of gene
keyword - Associated keywords in GenBank
library - Clone library (mostly for ESTs)
moddate - Last modification date
mrnaClone - Clone name (mostly for ESTs)
organism - Name of organism
productName - Protein product name
sex - Sex of organism
source - Source field in GenBank, often fairly redundant with other fields
tissue - Tissue isolated from
BIBLIOGRAFIA.

1. David Steffen, Ph.D. President, Biomedical Computing, Inc. Una Introducción A la Biocomputacion. Versión 2.01.Octubre De 1996. 6626 Westchester.Houston, Tejas 77005LOS E.E.U.U.

http://www. The Genome Browser Database.com

Dr. Steffen Schulze-Kremer. Metodología De Algoritmos genéticos. Westfälische Strasse 56, D-10711. Berlin.


Dr. Steffen Schulze-Kremer. Computo Evolutivo De Las Proteinas. Westfälische Strasse 56, D-10711. Berlin.

http://www.ibt.lamolina.edu.pe/bioinformática/genoma_vegetal.htm

http://www.bioplanet.net/reportajes-bioinformatica.htm

http://biotech.icmb.utexas.edu/pages/bioinform/BIdata.html

feedback@biotech.icmb.utexas.edu

Dr. Steffen Schulze-Kremer. Algoritmos Y Plegamiento Genéticos De La Proteína. Resultados. Westfälische Strasse 56, D-10711. Berlin.

Dr. Steffen Schulze-Kremer. Simulación Que Dobla De La Proteína Por La Optimización De Force Field. Westfälische Strasse 56, D-10711. Berlin.

Dr. Steffen Schulze-Kremer. Estrategia De La Evolución. Westfälische Strasse 56, D-10711. Berlin.

Dr. Steffen Schulze-Kremer. Operadores Genéticos. Westfälische Strasse 56, D-10711. Berlin.

Dr. Steffen Schulze-Kremer. Función De La Aptitud. Westfälische Strasse 56, D-10711. Berlin.

Dr. Steffen Schulze-Kremer. Resultados De La Predicción Ab Initio. Westfälische Strasse 56, D-10711. Berlin.

Dr. Steffen Schulze-Kremer. Colocación De La Cadena Lateral. Westfälische Strasse 56, D-10711. Berlin.

Rafael Lahoz-Beltrá. Bioinformatica: Simulación, Vida Artificial, Inteligencia Artificial, 2004. ISBN: 84-7978-645-0.

R. Durbin, S. Eddy, A. Krogh Y G. Mitchison. Biological Sequence Analysis, 1998. ISBN: 0-521-62971-3.

Dr. Steffen Schulze-Kremer. especializó a operadores genéticos. Westfälische Strasse 56, D-10711. Berlin.

Edwards, R.J. Y Protectores, C.C. BADASP: Especificidad Funcional Que Predice En Las Familias De La Proteína Que Usan Secuencias Ancestrales. Bioinformatics 21, 4190-4191 (2005). artículo PubMed ChemPort .

Dr. Steffen Schulze-Kremer. Resultados. Westfälische Strasse 56, D-10711. Berlin.

Dr. Steffen Schulze-Kremer. Resultados De La Prediccion Ab Initio. Westfälische Strasse 56, D-10711. Berlin.

Dr. Steffen Schulze-Kremer. Colocación de la cadena lateral. Westfälische Strasse 56, D-10711. Berlin.


Juan J Gomez-Reino. Jefe de Servicio de Reumatologia. La Medicina Personalizada. Hospital Clínico Universitario. Universidad de Santiago de Compostela.

No hay comentarios: