BioInformatics - Myanmar

BioInformatics - Myanmar

Share

Contact information, map and directions, contact form, opening hours, services, ratings, photos, videos and announcements from BioInformatics - Myanmar, Education, No 9/451, Maymyo.

22/01/2022
21/10/2021

How do you build a cell? Scientists from Delft University of Technology have proposed a potential strategy, utilizing a system-level evolutionary approach, in Frontiers in Bioengineering and Biotechnology.

Find out more about the bottom-up construction of an artificial living cell here ⬇
https://fro.ntiers.in/hgdJ

23/08/2021

Summer School on Machine Learning in Bioinformatics record file Part2

23/08/2021

Summer School on Machine Learning in Bioinformatics record file Part1

Photos from BioInformatics - Myanmar's post 13/08/2021

Overview of Sequencing Data Analysis and Adapter Trimming Design

sequencing ျပဳလုပ္သည့္အခါ sequence data ေတြကို fragment အပိုင္းေလးေတြျပဳလုပ္ၿပီး adapter ကပ္ၿပီးမွာ sequencing စက္ကေန sequence data ဖတ္တယ္။အဲလိုဖတ္တဲ့အခါ sequence data ေရာ adapter ေရာကို Fastq file အေနနဲ႔ စက္ကေနထုတ္ေပးပါတယ္။ ရရွိလာတဲ့ Fastq file ထဲက Fragment ေတြပါဝင္တဲ့ adapter ေတြကိုဖယ္မွသာလိုခ်င္တဲ့ sequence data ကိုရရွိၿပီး Analysis ျပဳလုပ္နိုင္မွာပါ။ အဲဒီလို adapter ေတြကို ဖယ္ထုတ္ျခင္းကို trimming ျပဳလုပ္တယ္လိုေျပာၾကပါသည္။ trimming ျပဳလုပ္တဲ့အခါ sequencing ျပဳလုပ္တဲ့အေပၚမူတည္ၿပီး adapter ေတြကို remove ျပဳလုပ္ရပါမယ္။ sequence ျပဳလုပ္သည့္အခါ single-end sequencing နဲ႔ paired-end sequencing ဆိုၿပီး ျပဳလုပ္ၾကပါသည္။ single-end sequencing ဆိုရင္ ေတာ့ forward fastq file က တစ္ခုပဲထြက္လာၿပီး paired-end sequencing ဆိုရင္ေတာ့ forward and reverse file ႏွစ္ခုထြက္လာပါသည္ (ဉပမာ 4_S1_L001_R1_001.fastq, 4_S1_L001_R2_001.fastq ) ။ Covid DNA sequencing ကို paired-end sequencing ျဖင့္ျပဳလုပ္သည့္အခါ ထြက္လာသည့္ file size က ႏွစ္ခုေပါင္း 300 mb ေလာက္ရွိပါသည္။ sequence base pair(TTTTGTTACTTAT) ေပါင္း million နဲ႔ ရွိပါတယ္။ million ေလာက္ရွိသည့္ sequence data ေတြထဲက ေရာေနတဲ့ adapter ေတြကို ဖယ္ထုတ္ဖို့ဆို ရင္ fragment sequence data ေတြနဲ႔ adapter ေတြ တည္ေဆာက္ပုံကို နားလည္းဖို့လိုပါတယ္။ ေအာက္ပါတြင္ ပုံမ်ားျဖင့္ေဖာ္ျပေပးထားပါတယ္။

Photos from BioInformatics - Myanmar's post 10/08/2021

AI (Convolutional Neural Network ) ကိုအသုံးပြုပြီး DNA sequence ကို prediction ပြုလုပ်ဖို့ဆိုရင် Convolutional Neural Network ကို အသေးစိတ်နားလည်းဖို့လိုအပ်ပါသည်။

Convolutional Neural Network (CNN) Theory အပြည့်အစုံ pdf file ကို အောက် ဖော်ပြပါလင့်တွင် download ပြုလုပ်နိုင်ပါသည်။

https://u.pcloud.link/publink/show?code=XZCQnwXZ1BauuGKJtljc0acPooqwG537jOFX

Photos from BioInformatics - Myanmar's post 01/08/2021

DNA sequence with CNN Convolutional Neural Network

29/07/2021

Prediction of COVID-19 with Deep Learning (Research Project)

Covid-19 sequence data ကို Deep learning ျဖစ္ျဖစ္ machine learning ျဖစ္ျဖစ္ research ျပဳလုပ္ျခင္း ္သူမ်ားအတြက္
1. Alpha
2. Beta
3. Delta
4. Eta
5. Gamma
6. Iota
7. Kappa
8. Lambda
9. Unknow
class 9 ခုပါၿပီး data file ကို ေအာက္ေဖာ္ျပ လင့္တြင္ download လုပ္နိုင္ပါတယ္။
https://u.pcloud.link/publink/show?code=XZessxXZsKBzlgJ1R7RkVDWE8DKod78PBzHV

ဒါမွမဟုတ္ ကိုယ္တိုင္ data file ကို create လုပ္ခ်င္းသူမ်ားအတြက္ ေအာက္ေဖာ္ျပပါတြင္ python code ကို ေလ့လာနိုင္ပါတယ္

from Bio import SeqIO
from os import getcwd
import os
import pandas as pd
path = 'CovidData/'
savefolder=''
i=1;
dataset=os.listdir(path)
data=[]
classes = []
for foldername in dataset:
fileos=os.listdir(path+foldername)
classes.append(foldername)
for file in fileos:
filepath=os.path.join(path,foldername,file)
for seq_record in SeqIO.parse(filepath, "fasta"):
DNA = seq_record.seq
data.append((i, DNA))
print(filepath+"-Class"+"-"+"-"+str(i))

i+=1
print("create data")
print(classes)
df = pd.DataFrame(data, columns=["Class", "Sequence"])
df.to_csv("conviddata.csv")
df.to_csv("convidata.txt",sep='\t',index=Flase)
with open('classes.txt', 'w') as f:
f.write('\n'.join(classes))

25/07/2021

About FASTQ Format

Bioinformatic မှာ ဇီဝဗေဒဆိုင်ရာအချက်အလက်များကို လေ့လာဖို့အတွက် DNA sequencing နည်းပညာက အရမ်းအရေးပါတဲ့ နည်းပညာတစ်ခုဖြစ်ပါသည်။ အခုဆိုရင် Covid ဗီဇ မျိုးကွဲတွေကိုလေ့လာတဲ့အခါမှာ DNA sequencing နည်းပညာကို သုံးပြုပြီး လေ့လာကြရပါတယ်။
Covid DNA sequencing ပြုလုပ်သည့်အခါ စက်မှထွက်လာသည့် Raw Data သည် FASTQ Format ဖြင့်ထွက်လာပါသည်။ sequence ပြလုပ်သည့်အပေါ်မူတည်ပြီး single-end sequencing ဆိုရင် တော့ forward fastq file က တစ်ခုပဲထွက်လာပြီး paired-end sequencing ဆိုရင်တော့ forward and reverse file နှစ်ခုထွက်လာပါသည် (ဉပမာ 4_S1_L001_R1_001.fastq, 4_S1_L001_R2_001.fastq ) ။ Covid DNA sequencing ကို paired-end sequencing ဖြင့်ပြုလုပ်သည့်အခါ ထွက်လာသည့် file size က နှစ်ခုပေါင်း 300 mb လောက်ရှိပါသည်။ sequence base pair(TTTTGTTACTTAT) ပေါင်း million နဲ့ ရှိပါတယ်။ Fastq format က nucleotide sequence တွေကို computer မှာ text base ဖြင့်သိမ်းဆည်းထားတာပါ။

Fastq Format မှာ nucleotide sequence တစ်ခုကို လိုင်း (၄)ခုဖြင့်သတ်မှတ်ထားပါသည်။

:1:000000000-JDTF6:1:1101:14880:1500 2:N:0:5
TTTTGTTACTTATAACCTCTGGAACACTTTTACAAGACTTCAGAGTTTAGATAATGTGGCTTTTAATGTTTTAAATAATGGACACTTTGATGGACAACAGGGTGAAGTACCAGTTTCTATCATTAATAACACTGTTTACACAAAAGTTGAT
+
1>>A11B33BD3B33B1BAF1111A00BFGF3B3110ABED2121DDF211221D2D21/BFGH21B2BD2A211D212211B1BFFG12D210B10>/0//B//11B2@121BGG2G2FG2FFD1F2211BF1GHHBEBD1?000BG12F

လိုင်း(၁)က sequence identifier သတ်မှတ်ထားပါသည်။
လိုင်း(၂)က sequence ပါ ။
လိုင်း(၃)က + တစ်ခုပဲရှိပါတယ်။ အဲဒီနောက်က လာမည့်လိုင်းက sequence တစ်လုံးချင်းရဲ့ Quality Scores ဖော်ပြပေးထားတာပါ။
လိုင်း(၄) က လိုင်း (၂) ထဲမှာရှိသည့် sequence တစ်လုံးချင်းရဲ့ Quality Scores ကိုဖော်ပြပေးထားတာပါ။

Yan Naing Soe

Want your school to be the top-listed School/college in Maymyo?

Click here to claim your Sponsored Listing.

Location

Category

Telephone

Website

Address


No 9/451
Maymyo
55343